В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
В 2024 году Национальному корпусу русского языка исполнилось 20 лет. По этому случаю отдел корпусной лингвистики Института русского языка им. В. В. Виноградова РАН совместно с Лабораторией компьютерной лингвистики ИППИ им. А. А. Харкевича РАН и Школой лингвистики ВШЭ организуют международную научную конференцию. Конференция состоится в Москве 20–21 декабря 2024 года в Институте русского языка РАН. Тематика конференции ...
...В 2024 году Национальному корпусу русского языка...
У онлайн-платформы две цели: помочь мигрантам выучить на базовом уровне русский язык и подготовиться к приезду в Россию. Для этого на сайте есть раздел «Жизнь в России», где собрана информация о государственном устройстве, работе и деловой коммуникации, правах иностранцев (в частности, трудовых мигрантов), возможностях получить образование, а также о традициях, привычках и «культурном коде» жителей России. Проект реализован ...
...У онлайн-платформы две цели: помочь мигрантам выучить...
«Русский диктант» — это просветительская акция, задача которой — популяризация русского языка среди иностранных граждан и соотечественников за рубежом. Акция проходит уже не первый год; любой желающий может бесплатно принять в ней участие онлайн. Инициатива проведения принадлежит Балтийскому федеральному университету им. И. Канта. Диктант будет транслироваться 25 января в 14:00 по Калининграду (UTC+2). Чтобы стать ...
...«Русский диктант» — это просветительская...
Баскский язык (эускара) десятилетиями считался белым пятном на лингвистической карте Европы. Окруженный романскими языками, он не имел известных родственников. Однако заполнить этот пробел могут находки, связанные с исчезнувшими народами Пиренейского полуострова. Группа исследователей под руководством палеолингвиста Эдуардо Ордуньи Аснара представила доказательства того, что у баскского был «родной брат» — древнеиберский язык. Иберы населяли восток и юг ...
...Баскский язык (эускара) десятилетиями считался белым...
Во время пандемии COVID-19 жители многих стран столкнулись с ограничениями на встречи, посещение общественных мест и мероприятий. Исследователи из Автономного университета Мадрида попытались выяснить, как эта ситуация отразилась на владении языком у детей, рожденных во время или накануне пандемии. Авторы сравнили оценки языкового развития 153 детей в возрасте от 18 до 31 месяца. Часть из них были рождены с октября 2019 по декабрь 2020 года, а часть — раньше (эту группу ...
...Во время пандемии COVID-19 жители многих стран столкнулись...
Ключевые изменения в генах, потенциально связанных с речью, произошли еще у общего предка современного человека (Homo sapiens), неандертальца и денисовца. Об этом свидетельствуют результаты исследования, опубликованного в журнале Scientific Reports. Международная группа исследователей проанализировала структуру более чем тысячи генов, связанных с функционированием нервной системы, у 34 видов современных приматов, а также у древних гоминидов.
...Ключевые изменения в генах, потенциально связанных...
Коллектив молодежной лаборатории лингвистической антропологии Камчатского государственного университета им. Витуса Беринга существенно продвинулся в документировании языкового наследия региона. За 2024–2025 годы диалектологи описали 2916 слов камчатского наречия, оцифровали 7,5 часа архивных аудиозаписей. Это часть масштабной работы по созданию электронного ресурса «Краткий словарь русских говоров Камчатки». Территориальная разновидность русского языка на ...
...Коллектив молодежной лаборатории лингвистической антропологии...
К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Авторы орфографического академического ресурса «Академос» Елена Арутюнова, Елена Бешенкова и Ольга Иванова обсудили с лингвистом Игорем Исаевым в подкасте «Сложное предложение» критерии отбора новых слов для включения в словарь, а также проблемы современного русского правописания.
...Авторы орфографического академического ресурса «...
...Орфография — это динамичная и сложная...