В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
В 2024 году Национальному корпусу русского языка исполнилось 20 лет. По этому случаю отдел корпусной лингвистики Института русского языка им. В. В. Виноградова РАН совместно с Лабораторией компьютерной лингвистики ИППИ им. А. А. Харкевича РАН и Школой лингвистики ВШЭ организуют международную научную конференцию. Конференция состоится в Москве 20–21 декабря 2024 года в Институте русского языка РАН. Тематика конференции ...
...В 2024 году Национальному корпусу русского языка...
У онлайн-платформы две цели: помочь мигрантам выучить на базовом уровне русский язык и подготовиться к приезду в Россию. Для этого на сайте есть раздел «Жизнь в России», где собрана информация о государственном устройстве, работе и деловой коммуникации, правах иностранцев (в частности, трудовых мигрантов), возможностях получить образование, а также о традициях, привычках и «культурном коде» жителей России. Проект реализован ...
...У онлайн-платформы две цели: помочь мигрантам выучить...
«Русский диктант» — это просветительская акция, задача которой — популяризация русского языка среди иностранных граждан и соотечественников за рубежом. Акция проходит уже не первый год; любой желающий может бесплатно принять в ней участие онлайн. Инициатива проведения принадлежит Балтийскому федеральному университету им. И. Канта. Диктант будет транслироваться 25 января в 14:00 по Калининграду (UTC+2). Чтобы стать ...
...«Русский диктант» — это просветительская...
Во время пандемии COVID-19 жители многих стран столкнулись с ограничениями на встречи, посещение общественных мест и мероприятий. Исследователи из Автономного университета Мадрида попытались выяснить, как эта ситуация отразилась на владении языком у детей, рожденных во время или накануне пандемии. Авторы сравнили оценки языкового развития 153 детей в возрасте от 18 до 31 месяца. Часть из них были рождены с октября 2019 по декабрь 2020 года, а часть — раньше (эту группу ...
...Во время пандемии COVID-19 жители многих стран столкнулись...
К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Выбором «слова года» занимаются авторитетные словари, языковые институты, газеты и сайты. С недавнего времени такую акцию проводит и Грамота. Чем отличается наш подход к определению «слова года»? Как мы собираем данные, фильтруем и оцениваем их? Приоткрываем дверь на нашу социолингвистическую кухню. И предупреждаем: у большого «слова года» будет свита из «главных слов» в разных сферах.
...Выбором «слова года» занимаются авторитетные...
...Вторые «выборы»: развиваем методологию...
Исследователи из Питтсбургского университета оценили, как воспринимаются стихи, созданные искусственным интеллектом, по сравнению с настоящей поэзией. Для этого они провели два эксперимента. Был создан пул из ста стихотворений, половина из которых была взята у таких классиков, как Уильям Шекспир, Джордж Байрон, Уолт Уитмен, Эмили Дикинсон и других. Вторая половина была сгенерирована ChatGPT 3.5 на основе стиля этих авторов. В первом эксперименте 1,6 тыс.
...Исследователи из Питтсбургского университета оценили...
Специалисты из Нью-Йоркского университета (NYU) предложили инновационный подход к пониманию многоязычия. Они разработали математическую формулу, которая позволяет оценить «интенсивность» и сбалансированность языкового опыта. Долгое время в лингвистике термин «билингв» использовался как бинарный показатель: человек либо владеет несколькими языками, либо нет. Однако такой подход не учитывает реальность, в которой один человек может свободно говорить ...
...Специалисты из Нью-Йоркского университета (NYU...
В конце августа на сайте Федерального института педагогических измерений (ФИПИ) появились проекты контрольных измерительных материалов ЕГЭ и ОГЭ 2025 года. Рассказываем об основных изменениях, которые коснулись экзаменов по русскому языку и литературе. ЕГЭ по русскому языку В задании 27 (сочинение) из ЕГЭ по русскому языку будет указана проблема текста, а от участника экзамена потребуется дать комментарий авторской позиции по ней. В прошлые годы выпускникам ...
...В конце августа на сайте Федерального института педагогических...