Как искусственный интеллект изменит возможности Грамоты
Сервисы обновленной Грамоты становятся более технологичными. Например, в них будут применяться нейронные сети. Руководитель ИИ-направления, компьютерный лингвист Михаил Копотев рассказал про основные направления работы и возможности новых технологий.
Грамота: Что изменится для пользователей в результате появления на портале искусственного интеллекта?
Михаил Копотев: Когда задумывалось обновление Грамоты, у команды было несколько основных задач. Одна из них — создание площадки, которая будет помогать пользователям работать с русским текстом. Было очевидно, что тех технологий, которые есть в существующих языковых сервисах, часто недостаточно для решения задач пользователя. Тогда ChatGPT еще не был публично доступен, но уже было понятно, что нас ждет много изменений.
Именно поэтому на Грамоте был создан отдел искусственного интеллекта. Мы работаем над несколькими новыми инструментами, которые помогут решать и совсем простые задачи, и более сложные.
Первое нововведение — это интеллектуальный поиск. Мы хотели не просто искать слово или фразу по всем разделам Грамоты, а понимать, в чем смысл запроса пользователя, какую именно информацию он ищет в данном случае.
Возьмем стандартные запросы на Грамоте: как правильно риелтер или риелтор, в чем разница компания или кампания. Нам как специалистам важно понять, что пользователя не интересуют слова «как правильно», не они являются предметом его запроса — этими словами он обращается к сотрудникам Справки и дает понять, что его интересует правописание (в первом случае) и значение (во втором). С другой стороны, нужное ему слово, например риелтор, может быть написано с ошибкой — именно для того, чтобы этой ошибки избежать, пользователь и пришел на сайт Грамоты.
Новая система поиска позволяет отсечь информационный шум, выделить ту часть запроса, которая отражает задачу пользователя, и подобрать лучший ответ с учетом возможных вариантов написания. Обычный поисковый алгоритм такие задачи не решает и решать не должен.
Второе направление — это подключение ИИ к одному из наших самых востребованных ресурсов — к Справке. Сейчас над ответами справочной службы Грамоты трудятся профессиональные лингвисты во главе с Еленой Арутюновой. За годы работы команда Справки ответила на сотни тысяч вопросов — это бесценная коллекция знаний о русском языке. Мы собираемся сделать работу с этими материалами более технологичной.
Каким образом? Вы имеете в виду поиск по уже имеющимся ответам? Вряд ли алгоритм сможет отвечать на вопросы вместо лингвистов.
М. К.: Интеллектуальная система будет вступать в роли помощника лингвистов и создавать шаблоны ответов на стандартные вопросы. Конечно, такой помощник не сможет предложить ответ на сложный или нестандартный вопрос, например не сумеет разобрать слово по составу или изложить всю историю происхождения какого-то выражения. Но для множества частотных и простых по сути запросов он существенно ускорит и упростит работу сотрудников Справки. Естественно, лингвисты будут проверять все созданные автоматически ответы, но им не придется писать их от начала до конца. Вместо этого они смогут сосредоточиться на более каверзных и сложных вопросах.
Мы надеемся, что сочетание профессиональной экспертности и машинной генерации увеличит скорость работы сервиса и сократит нагрузку на специалистов, связанную с набором и копированием текста ответов. В этом заключается один из принципов новой Грамоты: сочетание традиционного качества экспертизы и современных технологических решений.
Вы рассказали о ближайших изменениях, которые появятся прямо сейчас или в обозримом будущем. А как вы видите перспективы развития Грамоты? Над какими масштабными решениями вы работаете?
М. К.: Глобальная цель на ближайшие годы — создание текстового помощника. Этот сервис будет использовать и все преимущества современных языковых моделей, и мощь лексикографической и орфографической традиции, накопленной Грамотой.
Например, словари на Грамоте хранятся в очень удобной форме, которую легко интегрировать в систему автоматической проверки текстов — и это даст колоссальное улучшение качества. Допустим, вы создаете текст и хотите подобрать синонимы. С помощью словарей мы можем получить точный, но неполный список, а с помощью языковых моделей — более обширный, но менее точный. Сочетание того и другого способа даст более качественный результат, который будет полезен при работе над текстом. Это один из примеров того, на каких принципах мы создаем новый сервис.
Другой пример — проверка орфографии. Существующие спеллчекеры хорошо обрабатывают ошибки и опечатки вроде *карова, когда слово есть в словаре или его правописание регулируется однозначным правилом. Но в русском языке множество правил, которые устроены гораздо тоньше. Например, запятая перед «как», н/нн в суффиксах прилагательных и причастий и множество других. В таких случаях применение правил вызывает затруднения даже у грамотных людей и тем более при автоматической проверке. Машинное обучение поможет решить эту проблему.
Одно из достоинств больших языковых моделей состоит в том, что они сравнивают пользовательский документ с большим объемом существующих текстов и подсказывают правильный ответ исходя из статистической вероятности. Например, они могут сообщить, что похожие контексты содержат в этом случае запятую с вероятностью 100%, 80% или 30%.
Подобные сервисы наверняка уже существуют для английского, возможно, они есть и для других языков. Какие из них кажутся вам наиболее удачными, на что вы ориентируетесь?
М. К.: Таких сервисов множество. Пожалуй, самый известный из них — Grammarly. Он возник как простой спеллчекер для тех, кто пишет на английском, не будучи носителем этого языка. Сейчас это мощный и удобный текстовый помощник, который использует самые современные языковые модели. Теперь он не просто исправляет опечатки, но и предлагает более удачные формулировки и даже исправляет стиль документа.
Второй крупный игрок на этом рынке — компания Microsoft, которая разработала ChatGPT и интегрировала в свои приложения сервис Copilot. Мне нравится это название — «Второй пилот»: в нем скрывается метафора незаменимого помощника, который всегда на вторых ролях, но без которого трудно двигаться на современных скоростях. Этот сервис будет готовить для нас черновики писем, переводить документы на разные языки и, может быть, даже поможет с выполнением домашнего задания.
Как все это можно будет применять на практике для работы с русским языком?
М. К.: Конечно, можно ожидать, что новый сервис Грамоты будет востребован всеми, кто так или иначе работает с текстом: журналистами, редакторами, учителями… Но я вижу и более широкие задачи, которые позволяют облегчить жизнь людям в ситуациях, когда успешность их действий зависит от уровня владения языком.
Возьмем, например, мигрантов, которые владеют устной формой языка, но с письменной, особенно с бюрократической, у них возникают проблемы. В любом официальном учреждении такой человек сталкивается с трудностями, а часто и с откровенной дискриминацией. Наш текстовый помощник поможет такому клиенту правильно написать заявление или переведет текст с бюрократического на русский.
Это демократизация доступа к языку, которая помогает во взаимодействии с теми службами, где требуется знание языка.
Или другой пример: в любой большой компании есть документооборот, для которого существуют гласные или негласные правила. Например, какое-то технологическое явление или процесс принято называть определенным образом. Наш сервис при дополнительном обучении позволит работникам использовать терминологию так, чтобы тексты компании были унифицированы. Это уже трудно назвать спеллчекером, это именно интеллектуальный помощник.
Еще на
эту тему
Изучение русского языка: чем поможет Грамота
Руководитель образовательного направления Мария Лебедева делится идеями и планами
Чат-боты GPT и другие: что думают лингвисты о больших языковых моделях
Впереди демократизация порождения текстов и большие риски злоупотреблений
Семь современных «учебников» для тех, кто пишет и редактирует
Стандарты, кейсы и профессиональные приемы, которым вряд ли научат в вузе