Подсказки для поиска
Новогодняя игра: Грамота предсказывает будущее. Хочу погадать!
Хочу погадать!

Создан инструмент выбора текстов в помощь учителям малых языков России

К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было.

Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных языков. Оценка лингвистической сложности текстов очень важна не только для исследователей, но и для учителей — теперь они смогут легко подбирать учебные материалы по уровням, от простых к сложным.

Возьмем адыгейский язык. Он относится к числу полисинтетических: в нем одно слово может включать в себя то, что в русском выражается целым предложением, поэтому адыгейские слова в среднем гораздо длиннее русских или английских.

Если использовать стандартные коэффициенты, калькулятор будет считать абсолютно все адыгейские тексты «очень сложными» — и это исказит реальную оценку.

Команда Центра языка и мозга НИУ ВШЭ создала инструмент специально для работы с такими языками. Исследователи взяли за основу формулу удобочитаемости Флеша (он учитывает такие параметры, как длина, частотность слов, число «популярных» слов и т. д.) и адаптировали ее для каждого языка отдельно. Сейчас сервис позволяет работать с шестью малыми языками России — адыгейским, башкирским, бурятским, татарским, осетинским и удмуртским. Но, по словам создателей, его легко можно перенастраивать на другие малоресурсные языки.

Новая разработка пригодится и учителям (чтобы быстро отбирать тексты для разных классов), и авторам учебников (чтобы проверять, соответствует ли сложность текста заявленному уровню), и ученым-лингвистам (в экспериментах важно, чтобы тексты на разных языках были сопоставимы по сложности).

Сервис опирается на опыт лингвистов Антонины Лапошиной и Марии Лебедевой — авторов инструмента для оценки сложности русскоязычных текстов

Портал «Грамота.ру»

Еще на эту тему

Как измерить сложность и сбалансированность языка в учебниках?

Об этом — статья Антонины Лапошиной и Марии Лебедевой в журнале «Русский язык в школе»

Как пришествие корпусов меняет лингвистику

Почему корпусная лингвистика не прижилась в 1960-х годах и почему переживает расцвет сейчас

Изучение русского языка: чем поможет Грамота

Руководитель образовательного направления Мария Лебедева делится идеями и планами

все публикации

Сергей Татевосов: «Наш язык — организм с прекрасной системой пищеварения»

Как меняется русский язык? Лингвисты по просьбе Грамоты рассказывают о главных трендах

Супер, гипер, мега и другие: найдите десять отличий в значении приставок

Есть ли что-то общее у Супермена с суперпозицией, а у гипертекста — с гипермаркетом

Леонид Крысин: «Это было изучение всех ипостасей русского языка»

Лингвист рассказал порталу Arzamas о своей жизни и о том, зачем заниматься наукой

Фекла Толстая: «Язык становится разнообразнее»

Как меняется русский язык? Наши друзья и партнеры рассказывают о главных трендах

«Вы» с прописной буквы — правило устарело?

За подчеркнутой вежливостью может скрываться пассивная агрессия

Слово как оружие: фэнтези о тайной библиотеке и волшебной печатной машинке

В издательстве «МИФ» вышел перевод книги Карстена Хенна «Золотая печатная машинка»

Проявленность: следующий шаг после «быть собой»

В языке поп-психологии у осознанности появилась пара

«Академос» — орфографический ресурс, а не словарь новых слов

Сотрудники Института русского языка имени В. В. Виноградова рассказали о задачах онлайн-ресурса

Сигма: независимый одиночка

Как песня в исполнении двух юных девушек прославила новый тип мужчины

Лингвист Игорь Мельчук вспоминает о жизни и науке середины XX века

Ведущие подкаста «Глагольная группа» анонсировали серию разговоров со знаменитым ученым

Слоп: низкокачественный ИИ-контент

Когда нейросети засоряют интернет-пространство бессмысленными «помоями»

Федор Успенский: «Меня раздражает, когда привычные вещи, на которых я вырос, начинают меняться»

Как меняется русский язык? Лингвисты по просьбе Грамоты рассказывают о главных трендах

Ред-флаг: предупреждение об опасности

Тревожные звоночки еще можно игнорировать, а от красных флагов лучше сразу бежать

Пупупу: новое междометие

Реакция на негатив, задумчивость и принятие неизбежного

Промпт: запрос к языковой модели

С новыми технологиями в нашем активном лексиконе появляются и новые слова

Топонимические легенды предлагают яркие истории вместо этимологии

Откуда куропатки на гербе Курска и кто стрелял из лука в Великих Луках?

Подсветить: смысловое выделение

Модный глагол позволяет расставлять нужные акценты и влиять на восприятие информации

Лимб: зависнуть в неопределенности

Слово с богословскими корнями стало обозначать подвешенное состояние

Русские отчества: как вас по батюшке?

Исторически Иванов и Иванович — одно и то же

Выгорание: остался только пепел

Как редкое слово с техническим смыслом стало популярным обозначением последствий стресса

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!