Подсказки для поиска

Как искусственный интеллект изменит возможности Грамоты

Как искусственный интеллект изменит возможности Грамоты

Сервисы обновленной Грамоты становятся более технологичными. Например, в них будут применяться нейронные сети. Руководитель ИИ-направления, компьютерный лингвист Михаил Копотев рассказал про основные направления работы и возможности новых технологий.

Грамота: Что изменится для пользователей в результате появления на портале искусственного интеллекта?

Михаил Копотев: Когда задумывалось обновление Грамоты, у команды было несколько основных задач. Одна из них — создание площадки, которая будет помогать пользователям работать с русским текстом. Было очевидно, что тех технологий, которые есть в существующих языковых сервисах, часто недостаточно для решения задач пользователя. Тогда ChatGPT еще не был публично доступен, но уже было понятно, что нас ждет много изменений.

Именно поэтому на Грамоте был создан отдел искусственного интеллекта. Мы работаем над несколькими новыми инструментами, которые помогут решать и совсем простые задачи, и более сложные.

Первое нововведение — это интеллектуальный поиск. Мы хотели не просто искать слово или фразу по всем разделам Грамоты, а понимать, в чем смысл запроса пользователя, какую именно информацию он ищет в данном случае. 

Возьмем стандартные запросы на Грамоте: как правильно риелтер или риелтор, в чем разница компания или кампания. Нам как специалистам важно понять, что пользователя не интересуют слова «как правильно», не они являются предметом его запроса — этими словами он обращается к сотрудникам Справки и дает понять, что его интересует правописание (в первом случае) и значение (во втором). С другой стороны, нужное ему слово, например риелтор, может быть написано с ошибкой — именно для того, чтобы этой ошибки избежать, пользователь и пришел на сайт Грамоты.

Новая система поиска позволяет отсечь информационный шум, выделить ту часть запроса, которая отражает задачу пользователя, и подобрать лучший ответ с учетом возможных вариантов написания. Обычный поисковый алгоритм такие задачи не решает и решать не должен.

Второе направление — это подключение ИИ к одному из наших самых востребованных ресурсов — к Справке. Сейчас над ответами справочной службы Грамоты трудятся профессиональные лингвисты во главе с Еленой Арутюновой. За годы работы команда Справки ответила на сотни тысяч вопросов — это бесценная коллекция знаний о русском языке. Мы собираемся сделать работу с этими материалами более технологичной.

Каким образом? Вы имеете в виду поиск по уже имеющимся ответам? Вряд ли алгоритм сможет отвечать на вопросы вместо лингвистов.

М. К.: Интеллектуальная система будет вступать в роли помощника лингвистов и создавать  шаблоны ответов на стандартные вопросы. Конечно, такой помощник не сможет предложить ответ на сложный или нестандартный вопрос, например не сумеет разобрать слово по составу или изложить всю историю происхождения какого-то выражения. Но для множества частотных и простых по сути запросов он существенно ускорит и упростит работу сотрудников Справки. Естественно, лингвисты будут проверять все созданные автоматически ответы, но им не придется писать их от начала до конца. Вместо этого они смогут сосредоточиться на более каверзных и сложных вопросах.

Мы надеемся, что сочетание профессиональной экспертности и машинной генерации увеличит скорость работы сервиса и сократит нагрузку на специалистов, связанную с набором и копированием текста ответов. В этом заключается один из принципов новой Грамоты: сочетание традиционного качества экспертизы и современных технологических решений.

Вы рассказали о ближайших изменениях, которые появятся прямо сейчас или в обозримом будущем. А как вы видите перспективы развития Грамоты? Над какими масштабными решениями вы работаете?

М. К.: Глобальная цель на ближайшие годы — создание текстового помощника. Этот сервис будет использовать и все преимущества современных языковых моделей, и мощь лексикографической и орфографической традиции, накопленной Грамотой.

Например, словари на Грамоте хранятся в очень удобной форме, которую легко интегрировать в систему автоматической проверки текстов — и это даст колоссальное улучшение качества. Допустим, вы создаете текст и хотите подобрать синонимы. С помощью словарей мы можем получить точный, но неполный список, а с помощью языковых моделей — более обширный, но менее точный. Сочетание того и другого способа даст более качественный результат, который будет полезен при работе над текстом. Это один из примеров того, на каких принципах мы создаем новый сервис.

Другой пример — проверка орфографии. Существующие спеллчекеры хорошо обрабатывают ошибки и опечатки вроде *карова, когда слово есть в словаре или его правописание регулируется однозначным правилом. Но в русском языке множество правил, которые устроены гораздо тоньше. Например, запятая перед «как», н/нн в суффиксах прилагательных и причастий и множество других. В таких случаях применение правил вызывает затруднения даже у грамотных людей и тем более при автоматической проверке. Машинное обучение поможет решить эту проблему.

Одно из достоинств больших языковых моделей состоит в том, что они сравнивают пользовательский документ с большим объемом существующих текстов и подсказывают правильный ответ исходя из статистической вероятности. Например, они могут сообщить, что похожие контексты содержат в этом случае запятую с вероятностью 100%, 80% или 30%.

Подобные сервисы наверняка уже существуют для английского, возможно, они есть и для других языков. Какие из них кажутся вам наиболее удачными, на что вы ориентируетесь?

М. К.: Таких сервисов множество. Пожалуй, самый известный из них — Grammarly. Он возник как простой спеллчекер для тех, кто пишет на английском, не будучи носителем этого языка. Сейчас это мощный и удобный текстовый помощник, который использует самые современные языковые модели. Теперь он не просто исправляет опечатки, но и предлагает более удачные формулировки и даже исправляет стиль документа.

Второй крупный игрок на этом рынке — компания Microsoft, которая разработала ChatGPT и интегрировала в свои приложения сервис Copilot. Мне нравится это название — «Второй пилот»: в нем скрывается метафора незаменимого помощника, который всегда на вторых ролях, но без которого трудно двигаться на современных скоростях. Этот сервис будет готовить для нас черновики писем, переводить документы на разные языки и, может быть, даже поможет с выполнением домашнего задания.

Как все это можно будет применять на практике для работы с русским языком?

М. К.: Конечно, можно ожидать, что новый сервис Грамоты будет востребован всеми, кто так или иначе работает с текстом: журналистами, редакторами, учителями… Но я вижу и более широкие задачи, которые позволяют облегчить жизнь людям в ситуациях, когда успешность их действий зависит от уровня владения языком.

Возьмем, например, мигрантов, которые владеют устной формой языка, но с письменной, особенно с бюрократической, у них возникают проблемы. В любом официальном учреждении такой человек сталкивается с трудностями, а часто и с откровенной дискриминацией. Наш текстовый помощник поможет такому клиенту правильно написать заявление или переведет текст с бюрократического на русский.

Это демократизация доступа к языку, которая помогает во взаимодействии с теми службами, где требуется знание языка.

Или другой пример: в любой большой компании есть документооборот, для которого существуют гласные или негласные правила. Например, какое-то технологическое явление или процесс принято называть определенным образом. Наш сервис при дополнительном обучении позволит работникам использовать терминологию так, чтобы тексты компании были унифицированы. Это уже трудно назвать спеллчекером, это именно интеллектуальный помощник.

, редактор Грамоты

Еще на эту тему

Изучение русского языка: чем поможет Грамота

Руководитель образовательного направления Мария Лебедева делится идеями и планами

Чат-боты GPT и другие: что думают лингвисты о больших языковых моделях

Впереди демократизация порождения текстов и большие риски злоупотреблений

Семь современных «учебников» для тех, кто пишет и редактирует

Стандарты, кейсы и профессиональные приемы, которым вряд ли научат в вузе

все публикации

Владимир Гиляровский, «король репортеров»

К 170-летию со дня рождения писателя и журналиста Музей Москвы показывает документы из найденного недавно архива 

Он или она? Как языки обходятся без указания на пол

Есть разные способы избежать уточнения или, наоборот, внести ясность

Могут ли нейросети написать «Войну и мир» и куда они заведут человечество

На форуме «Территория будущего. Москва 2030» рассказали о возможностях ИИ

Слова на карте: как лексика объединяет и разделяет страны

Лингвистические карты показывают родство языков и языковые контакты

Сергей Ожегов, борец за самобытность родного языка

К 125-летию со дня рождения лексикографа рассказываем о десяти фактах его биографии

Калеб Эверетт написал книгу о языковом многообразии

Научный редактор книги Валерий Шульгинов представляет ее читателям Грамоты

Как эвфемизмы в рекламе влияют на наше поведение

«Спецпредложение» звучит более заманчиво, чем «скидка»

А и Б сидели на трубе: семь детских книг о буквах и знаках

Иногда А, Я и даже точка могут стать главными героями поучительных историй

Опять запятые! Сложный пунктуационный тест

Десять цитат из русской классики, которые нужно написать без ошибок

Михаил Штудинер не спешит изгонять из языка то, что в нем еще живо

Автор «Словаря трудностей русского языка» — об объективном характере нормы и ее субъективной фиксации

Как менялись библиотеки?

История книжных коллекций от собраний табличек до храмов литературы в новой книге МИФа

Новое образование для «нового человека»: как учили грамоте в советской школе сто лет назад

31 августа исполняется сто лет декрету о всеобщем начальном обучении в РСФСР

Язык и пространство: что находится в центре мира?

Реки, горы и стороны света могут быть встроены в языковую систему координат, объясняет Валерий Шульгинов

Курсы лекций Ирины Кобозевой и Андрея Кибрика доступны на платформе Teach-in

Не нужно быть студентом, чтобы погрузиться в лексическую семантику и ареальную лингвистику

Как философы пытались создать идеальные языки

Продуманные, точные — но абсолютно непригодные для общения

Чем речовка лучше речевки? Три переменчивых неологизма XX века 

Раньше слова «речовка», «плащовка» и «мелочовка» писались по-другому

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!