Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
С наличием в языке вариантов связано сразу несколько распространенных заблуждений. Считается, что в литературном языке не должно быть двух правильных вариантов одного и того же слова; наличие вариантов в словарях свидетельствует только о том, что лингвисты не могут договориться между собой; варианты в словарях — примета нашего времени, в изданиях прежних лет варианты не допускались. На самом деле вариантность — непременный атрибут литературного языка, а фиксация вариантов в словарях — неотъемлемая часть работы лингвистов-кодификаторов.
...С наличием в языке вариантов связано сразу несколько...
...Скажите, как правильнее! Бо́льшая часть вопросов,...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Ведущий подкаста «Сложное предложение» лингвист Игорь Исаев пригласил авторов книги «Запретные слова», докторов филологических наук Анатолия Баранова и Дмитрия Добровольского поговорить о русском мате: его изучении, его уместности и его табуированности. Грамота изложила близко к тексту фрагменты этого разговора.
...Ведущий подкаста «Сложное предложение»...
...Игорь Исаев: Зачем было писать эту книгу? Дмитрий...
В 2024 году Национальному корпусу русского языка исполнилось 20 лет. По этому случаю отдел корпусной лингвистики Института русского языка им. В. В. Виноградова РАН совместно с Лабораторией компьютерной лингвистики ИППИ им. А. А. Харкевича РАН и Школой лингвистики ВШЭ организуют международную научную конференцию. Конференция состоится в Москве 20–21 декабря 2024 года в Институте русского языка РАН. Тематика конференции ...
...В 2024 году Национальному корпусу русского языка...
Сервис управления соцсетями LiveDune совместно с СПбГУ провел масштабное исследование современного российского интернет-сленга. Набор данных включал 56 млн комментариев, оставленных в самых популярных в России социальных сетях. Выявлением сленга занималась нейросеть «Ольга Станиславовна», созданная командой LiveDune специально для оценки тональности соцсетевого контента. Авторы проанализировали частотность использования сленговых слов и составили рейтинг самых распространенных.
...Сервис управления соцсетями LiveDune совместно с СПбГУ...
Конференция «Языки России в контакте с русским языком» состоится уже в третий раз в Институте русского языка им. В. В. Виноградова РАН. Ее организует группа по исследованию контактного взаимодействия русского языка с языками народов России при отделе корпусной лингвистики и лингвистической поэтики ИРЯ РАН с участием коллег из других организаций. К участию приглашаются специалисты по отдельным языкам и группам языков коренных народов ...
...Конференция «Языки России в контакте с русским...
В новом номере журнала «Русская речь» наше внимание привлекли три статьи: о киргизском варианте русского языка, об акцентуации фразеологизмов и о происхождении слова инфохомяк. Также из этого номера можно узнать о частице чай в среднерусском говоре, заимствованиях из китайского и истории выражения хоть (матушку) репку пой.
...В новом номере журнала «Русская речь»...
...Баран мясо Авторы статьи, лингвисты Егор Кашкин и&...
После окончательной обработки данных 2025 года исследователи ожидают появления на лексикографическом ресурсе еще не менее двухсот новых слов. Об этом сообщил доктор филологических наук, руководитель группы «Словари новых слов» института Валерий Ефремов. Среди зафиксированных неологизмов есть и те, что попали в наш шорт-лист слов года (или были образованы от них), — брейнрот-персонаж, зумерский, слоппер и т. д. Ряд неологизмов отражает актуальные ...
...После окончательной обработки данных 2025 года исследователи...
19 апреля Дом творчества Переделкино станет площадкой однодневного фестиваля «Энергия жизни: Север, Сибирь и Дальний Восток», посвященного культуре и языкам коренных малочисленных народов России. Мероприятие проводится в рамках литературной мастерской, приуроченной к 90-летию Владимира Санги, основателя нивхской литературы. Особое внимание будет уделено вопросам сохранения исчезающих языков. В 15:00 младшие научные сотрудники Научного центра по сохранению, возрождению ...
...19 апреля Дом творчества Переделкино станет площадкой...