В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
В 2024 году Национальному корпусу русского языка исполнилось 20 лет. По этому случаю отдел корпусной лингвистики Института русского языка им. В. В. Виноградова РАН совместно с Лабораторией компьютерной лингвистики ИППИ им. А. А. Харкевича РАН и Школой лингвистики ВШЭ организуют международную научную конференцию. Конференция состоится в Москве 20–21 декабря 2024 года в Институте русского языка РАН. Тематика конференции ...
...В 2024 году Национальному корпусу русского языка...
У онлайн-платформы две цели: помочь мигрантам выучить на базовом уровне русский язык и подготовиться к приезду в Россию. Для этого на сайте есть раздел «Жизнь в России», где собрана информация о государственном устройстве, работе и деловой коммуникации, правах иностранцев (в частности, трудовых мигрантов), возможностях получить образование, а также о традициях, привычках и «культурном коде» жителей России. Проект реализован ...
...У онлайн-платформы две цели: помочь мигрантам выучить...
Во время пандемии COVID-19 жители многих стран столкнулись с ограничениями на встречи, посещение общественных мест и мероприятий. Исследователи из Автономного университета Мадрида попытались выяснить, как эта ситуация отразилась на владении языком у детей, рожденных во время или накануне пандемии. Авторы сравнили оценки языкового развития 153 детей в возрасте от 18 до 31 месяца. Часть из них были рождены с октября 2019 по декабрь 2020 года, а часть — раньше (эту группу ...
...Во время пандемии COVID-19 жители многих стран столкнулись...
Многие из тех, кто учил иностранный язык в школе, признаются, что умеют рассуждать о мировой политике или защите окружающей среды, но теряются, когда нужно правильно назвать венчик для взбивания, определенный вид встроенного шкафа или шапочку с помпоном. В процессе перевода тоже возникают похожие трудности с конкретной лексикой, когда одним словом могут быть названы очень разные предметы. Переводчик с итальянского Анна Ямпольская рассказала Грамоте, на какие ухищрения приходится идти, чтобы отличить пиджак от куртки, а панаму от ушанки.
...Многие из тех, кто учил иностранный язык в школе, признаются...
...Как известно, костюм — одна из важнейших характеристик...
К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Выбором «слова года» занимаются авторитетные словари, языковые институты, газеты и сайты. С недавнего времени такую акцию проводит и Грамота. Чем отличается наш подход к определению «слова года»? Как мы собираем данные, фильтруем и оцениваем их? Приоткрываем дверь на нашу социолингвистическую кухню. И предупреждаем: у большого «слова года» будет свита из «главных слов» в разных сферах.
...Выбором «слова года» занимаются авторитетные...
...Вторые «выборы»: развиваем методологию...
Исследователи из Питтсбургского университета оценили, как воспринимаются стихи, созданные искусственным интеллектом, по сравнению с настоящей поэзией. Для этого они провели два эксперимента. Был создан пул из ста стихотворений, половина из которых была взята у таких классиков, как Уильям Шекспир, Джордж Байрон, Уолт Уитмен, Эмили Дикинсон и других. Вторая половина была сгенерирована ChatGPT 3.5 на основе стиля этих авторов. В первом эксперименте 1,6 тыс.
...Исследователи из Питтсбургского университета оценили...
В связи с шестидесятилетием действующих правил правописания предлагаем вниманию читателей архивную статью Сергея Ефимовича Крючкова, опубликованную 26 мая 1956 года в «Учительской газете». В этой статье сообщается об утверждении нового свода правил русского правописания, который официально действует до сих пор (сам свод правил был принят весной и издан в августе 1956 года, к началу нового учебного года). Автор рассказывает о принципах унификации правописания, о практических шагах по введению нового свода.
...В связи с шестидесятилетием действующих правил правописания...
...Предисловие «Грамоты.ру» Сергей Ефимович...
В журнале «Неофилология» вышла статья филологов Ольги Ребковец и Натальи Милянчук о том, как изменилась система жанров научно-популярного изложения в связи с развитием технологий. Авторы рассматривают, какую цель преследует тот или иной текст и какие коммуникативные позиции занимают автор и адресат.
...В журнале «Неофилология» вышла статья...
...С начала XXI века объем текстов в научно-популярном...