Подсказки для поиска

Создан инструмент выбора текстов в помощь учителям малых языков России

К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было.

Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных языков. Оценка лингвистической сложности текстов очень важна не только для исследователей, но и для учителей — теперь они смогут легко подбирать учебные материалы по уровням, от простых к сложным.

Возьмем адыгейский язык. Он относится к числу полисинтетических: в нем одно слово может включать в себя то, что в русском выражается целым предложением, поэтому адыгейские слова в среднем гораздо длиннее русских или английских.

Если использовать стандартные коэффициенты, калькулятор будет считать абсолютно все адыгейские тексты «очень сложными» — и это исказит реальную оценку.

Команда Центра языка и мозга НИУ ВШЭ создала инструмент специально для работы с такими языками. Исследователи взяли за основу формулу удобочитаемости Флеша (он учитывает такие параметры, как длина, частотность слов, число «популярных» слов и т. д.) и адаптировали ее для каждого языка отдельно. Сейчас сервис позволяет работать с шестью малыми языками России — адыгейским, башкирским, бурятским, татарским, осетинским и удмуртским. Но, по словам создателей, его легко можно перенастраивать на другие малоресурсные языки.

Новая разработка пригодится и учителям (чтобы быстро отбирать тексты для разных классов), и авторам учебников (чтобы проверять, соответствует ли сложность текста заявленному уровню), и ученым-лингвистам (в экспериментах важно, чтобы тексты на разных языках были сопоставимы по сложности).

Сервис опирается на опыт лингвистов Антонины Лапошиной и Марии Лебедевой — авторов инструмента для оценки сложности русскоязычных текстов

Портал «Грамота.ру»

Еще на эту тему

Как измерить сложность и сбалансированность языка в учебниках?

Об этом — статья Антонины Лапошиной и Марии Лебедевой в журнале «Русский язык в школе»

Как пришествие корпусов меняет лингвистику

Почему корпусная лингвистика не прижилась в 1960-х годах и почему переживает расцвет сейчас

Изучение русского языка: чем поможет Грамота

Руководитель образовательного направления Мария Лебедева делится идеями и планами

все публикации

10 слов, в которых нам наконец разрешили привычные варианты ударений

«Большой словарь ударений» признает влияние узуса на норму

Курс Владимира Плунгяна поможет разобраться в основах лингвистики

Уникальное свойство языка — делать мысль материальной

«Обязательная программа»: что общего есть у разных языков

Олег Беляев объясняет, как сравнение непохожих языков помогает понять логику их развития

Смешенье языков: можно ли скрестить русский с китайским?

Лингвист Валерий Шульгинов описывает свойства этого гибрида, опираясь на данные реальных пиджинов

Как русский язык помогает осваивать другие школьные предметы

Рассказывают учителя — финалисты четвертого сезона проекта «Классная тема!»

Что значит «залететь в реки»?

Лингвист Ирина Левонтина изучила новые употребления русского приставочного глагола

Зачем нужно сохранять исчезающие языки

Лингвист Ольга Казакевич — о ценности языкового разнообразия для человека и общества

Псевдо, квази, эрзац и другие: пять способов указать на неполное сходство

Чем отличаются разные виды «фейков» с лингвистической точки зрения

Русский язык не сводится к его литературной форме. Лекция Максима Кронгауза

Субстандарт: питательная среда или испытательный полигон?

Откуда берутся разные варианты произношения?

Вышла книга Марии Каленчук об орфоэпических словарях

Одушевленное и неодушевленное в языке: как в этом разобраться

Почему мы встречаем важного клиента, но на компьютер устанавливаем клиент

Изоляты — языки без «родственников»

Как получилось, что им не нашлось места ни в одной языковой семье?

Берестяные грамоты находят даже в вечной мерзлоте

Алексей Гиппиус рассказал об итогах раскопок 2025 года

Лингвист Наталья Брагина о вежливости и конфликтной коммуникации в XXI веке

В выпуске программы «Говорим по-русски!» рассказали о том, как интонация и частицы могут сделать вежливое высказывание грубым

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!