Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
«Газета.ру» пишет об исследовании тавтологии, опубликованном в научном журнале Journal of Pragmatics. Его авторы — сотрудники Санкт-Петербургского государственного университета, Мадридского университета Комплутенсе (Испания) и Высшей школы экономики (Москва) Елена Вилинбахова, Виктория Эскандель-Видаль и Наталья Зевахина.
...«Газета.ру» пишет об исследовании тавтологии...
...Лингвисты провели эксперимент, в основе которого...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Отдел языкознания Института научной информации по общественным наукам Российской академии наук (ИНИОН РАН), Институт языкознания РАН и Государственный академический университет гуманитарных наук приглашают принять участие в международной научно-практической конференции «Фундаментальные исследования и прикладные разработки в современном языкознании: к 300-летию Российской академии наук». Основные направления работы конференции: «Язык в ...
...Отдел языкознания Института научной информации по общественным...
Институт лингвистических исследований Российской академии наук (ИЛИ РАН) приглашает принять участие в Международной научной конференции, посвященной столетию со дня рождения специалиста по лексикографии и диалектологии, много лет занимавшего позицию главного научного сотрудника ИЛИ РАН, — Федора Павловича Сороколетова. Ф. П. Сороколетов (08.03.1924 — 20.12.2008) — доктор филологических наук, профессор, автор более двухсот научных трудов по ...
...Институт лингвистических исследований Российской академии...
Банкаброшница — это не банковская работница, а работница, обслуживающая прядильную машину. Название профессии происходит от французского банкаброш (banc a broches, букв. «станок со спицами»). Это слово представлено в «Толковом словаре русского языка» под ред. Д. Н. Ушакова (1935–1940) как неологизм, технический термин. Толкуется оно так: ‘машина в бумагопрядильном производстве, разбивающая массу хлопкового волокна на отдельные, более ...
...Банкаброшница — это не банковская работница,...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...
Статьи номера посвящены произношению согласных, восприятию диалекта, карнавализации, семантике глагольных циркумфиксов и слова «Земля», а также языку образов времени и языку художественной литературы. Отметим некоторые из них.
...Статьи номера посвящены произношению согласных, восприятию...
...К семантике русских глагольных циркумфиксов. Циркумфикс...
Каждый десятый участник «Тотального диктанта» справился с ним на высшем уровне. Об этом сообщил председатель Филологического совета Тотального диктанта, научный сотрудник Института русского языка им. В. В. Виноградова РАН Владимир Пахомов. Количество отличников незначительно изменялось в зависимости от того, какую часть диктанта писали участники, — самой легкой оказалась четвертая часть. При этом в тексте, который предложила автор ...
...Каждый десятый участник «Тотального диктанта&...
Международная акция «Тотальный диктант» пройдет 20 апреля уже в двадцать первый раз. Ее цель — объединить всех, кто любит русский язык, хочет лучше писать и говорить по-русски. Кроме того, диктант знакомит участников с современной литературой на русском языке: автором текста диктанта каждый год выбирают российского писателя. В 2024 году им стала Анна Матвеева, известная благодаря роману «Перевал Дятлова, или Тайна девяти». Вот ...
...Международная акция «Тотальный диктант»...