Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Как искусственный интеллект изменит возможности Грамоты

Как искусственный интеллект изменит возможности Грамоты

Сервисы обновленной Грамоты становятся более технологичными. Например, в них будут применяться нейронные сети. Руководитель ИИ-направления, компьютерный лингвист Михаил Копотев рассказал про основные направления работы и возможности новых технологий.

Грамота: Что изменится для пользователей в результате появления на портале искусственного интеллекта?

Михаил Копотев: Когда задумывалось обновление Грамоты, у команды было несколько основных задач. Одна из них — создание площадки, которая будет помогать пользователям работать с русским текстом. Было очевидно, что тех технологий, которые есть в существующих языковых сервисах, часто недостаточно для решения задач пользователя. Тогда ChatGPT еще не был публично доступен, но уже было понятно, что нас ждет много изменений.

Именно поэтому на Грамоте был создан отдел искусственного интеллекта. Мы работаем над несколькими новыми инструментами, которые помогут решать и совсем простые задачи, и более сложные.

Первое нововведение — это интеллектуальный поиск. Мы хотели не просто искать слово или фразу по всем разделам Грамоты, а понимать, в чем смысл запроса пользователя, какую именно информацию он ищет в данном случае. 

Возьмем стандартные запросы на Грамоте: как правильно риелтер или риелтор, в чем разница компания или кампания. Нам как специалистам важно понять, что пользователя не интересуют слова «как правильно», не они являются предметом его запроса — этими словами он обращается к сотрудникам Справки и дает понять, что его интересует правописание (в первом случае) и значение (во втором). С другой стороны, нужное ему слово, например риелтор, может быть написано с ошибкой — именно для того, чтобы этой ошибки избежать, пользователь и пришел на сайт Грамоты.

Новая система поиска позволяет отсечь информационный шум, выделить ту часть запроса, которая отражает задачу пользователя, и подобрать лучший ответ с учетом возможных вариантов написания. Обычный поисковый алгоритм такие задачи не решает и решать не должен.

Второе направление — это подключение ИИ к одному из наших самых востребованных ресурсов — к Справке. Сейчас над ответами справочной службы Грамоты трудятся профессиональные лингвисты во главе с Еленой Арутюновой. За годы работы команда Справки ответила на сотни тысяч вопросов — это бесценная коллекция знаний о русском языке. Мы собираемся сделать работу с этими материалами более технологичной.

Каким образом? Вы имеете в виду поиск по уже имеющимся ответам? Вряд ли алгоритм сможет отвечать на вопросы вместо лингвистов.

М. К.: Интеллектуальная система будет вступать в роли помощника лингвистов и создавать  шаблоны ответов на стандартные вопросы. Конечно, такой помощник не сможет предложить ответ на сложный или нестандартный вопрос, например не сумеет разобрать слово по составу или изложить всю историю происхождения какого-то выражения. Но для множества частотных и простых по сути запросов он существенно ускорит и упростит работу сотрудников Справки. Естественно, лингвисты будут проверять все созданные автоматически ответы, но им не придется писать их от начала до конца. Вместо этого они смогут сосредоточиться на более каверзных и сложных вопросах.

Мы надеемся, что сочетание профессиональной экспертности и машинной генерации увеличит скорость работы сервиса и сократит нагрузку на специалистов, связанную с набором и копированием текста ответов. В этом заключается один из принципов новой Грамоты: сочетание традиционного качества экспертизы и современных технологических решений.

Вы рассказали о ближайших изменениях, которые появятся прямо сейчас или в обозримом будущем. А как вы видите перспективы развития Грамоты? Над какими масштабными решениями вы работаете?

М. К.: Глобальная цель на ближайшие годы — создание текстового помощника. Этот сервис будет использовать и все преимущества современных языковых моделей, и мощь лексикографической и орфографической традиции, накопленной Грамотой.

Например, словари на Грамоте хранятся в очень удобной форме, которую легко интегрировать в систему автоматической проверки текстов — и это даст колоссальное улучшение качества. Допустим, вы создаете текст и хотите подобрать синонимы. С помощью словарей мы можем получить точный, но неполный список, а с помощью языковых моделей — более обширный, но менее точный. Сочетание того и другого способа даст более качественный результат, который будет полезен при работе над текстом. Это один из примеров того, на каких принципах мы создаем новый сервис.

Другой пример — проверка орфографии. Существующие спеллчекеры хорошо обрабатывают ошибки и опечатки вроде *карова, когда слово есть в словаре или его правописание регулируется однозначным правилом. Но в русском языке множество правил, которые устроены гораздо тоньше. Например, запятая перед «как», н/нн в суффиксах прилагательных и причастий и множество других. В таких случаях применение правил вызывает затруднения даже у грамотных людей и тем более при автоматической проверке. Машинное обучение поможет решить эту проблему.

Одно из достоинств больших языковых моделей состоит в том, что они сравнивают пользовательский документ с большим объемом существующих текстов и подсказывают правильный ответ исходя из статистической вероятности. Например, они могут сообщить, что похожие контексты содержат в этом случае запятую с вероятностью 100%, 80% или 30%.

Подобные сервисы наверняка уже существуют для английского, возможно, они есть и для других языков. Какие из них кажутся вам наиболее удачными, на что вы ориентируетесь?

М. К.: Таких сервисов множество. Пожалуй, самый известный из них — Grammarly. Он возник как простой спеллчекер для тех, кто пишет на английском, не будучи носителем этого языка. Сейчас это мощный и удобный текстовый помощник, который использует самые современные языковые модели. Теперь он не просто исправляет опечатки, но и предлагает более удачные формулировки и даже исправляет стиль документа.

Второй крупный игрок на этом рынке — компания Microsoft, которая разработала ChatGPT и интегрировала в свои приложения сервис Copilot. Мне нравится это название — «Второй пилот»: в нем скрывается метафора незаменимого помощника, который всегда на вторых ролях, но без которого трудно двигаться на современных скоростях. Этот сервис будет готовить для нас черновики писем, переводить документы на разные языки и, может быть, даже поможет с выполнением домашнего задания.

Как все это можно будет применять на практике для работы с русским языком?

М. К.: Конечно, можно ожидать, что новый сервис Грамоты будет востребован всеми, кто так или иначе работает с текстом: журналистами, редакторами, учителями… Но я вижу и более широкие задачи, которые позволяют облегчить жизнь людям в ситуациях, когда успешность их действий зависит от уровня владения языком.

Возьмем, например, мигрантов, которые владеют устной формой языка, но с письменной, особенно с бюрократической, у них возникают проблемы. В любом официальном учреждении такой человек сталкивается с трудностями, а часто и с откровенной дискриминацией. Наш текстовый помощник поможет такому клиенту правильно написать заявление или переведет текст с бюрократического на русский.

Это демократизация доступа к языку, которая помогает во взаимодействии с теми службами, где требуется знание языка.

Или другой пример: в любой большой компании есть документооборот, для которого существуют гласные или негласные правила. Например, какое-то технологическое явление или процесс принято называть определенным образом. Наш сервис при дополнительном обучении позволит работникам использовать терминологию так, чтобы тексты компании были унифицированы. Это уже трудно назвать спеллчекером, это именно интеллектуальный помощник.

, редактор Грамоты

Еще на эту тему

Изучение русского языка: чем поможет Грамота

Руководитель образовательного направления Мария Лебедева делится идеями и планами

Чат-боты GPT и другие: что думают лингвисты о больших языковых моделях

Впереди демократизация порождения текстов и большие риски злоупотреблений

Семь современных «учебников» для тех, кто пишет и редактирует

Стандарты, кейсы и профессиональные приемы, которым вряд ли научат в вузе

все публикации

Как современные технологии помогают оценить сложность текста

Инструменты компьютерной лингвистики лучше всего работают с учебными материалами


В языке все уже изучено или ученым есть чем заняться?

В телепередаче «Наблюдатель» члены Российской академии наук обсуждали самое интересное в науке о языке


Новый толковый словарь — источник точной и интересной информации для школьника

Авторы рассказывают, как устроен словарь и как его можно использовать на уроках и дома


Как разное понимание языковой нормы приводит к коммуникативным неудачам

Выступление научного консультанта Грамоты Владимира Пахомова на конференции «Медиатекст: векторы развития и перспективы изучения» 


Наш человек! Как появились и что значат названия народов — этнонимы

От имен легендарных прародителей до прозвищ, данных соседями


Шепот на ухо и бесконечный пазл: две истории о переводе с турецкого

Тюрколог Аполлинария Аврутина переводила не только Орхана Памука, но и суфийскую поэзию XIII века


Вышел в свет второй выпуск журнала «Русская речь» за 2024 год

В нем анализируют такие языковые единицы, как «босяки», «верги» и «зеленые береты»


Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»

ИИ не способен к оригинальному мышлению и творческому осмыслению информации


Мягенький заинька у плохонькой березоньки: по каким правилам пишутся уменьшительно-ласкательные суффиксы?

Каждый месяц мы выбираем и комментируем три вопроса, на которые ответила наша справочная служба



Вышел в подарочном издании «Словарь поэтических иносказаний Пушкина» Валерия Сомова

Автор считал этот словарь кентавром: «По форме — справочник, по сути же — книга для занимательного чтения»


Подкаст «Что это значит?» проясняет смысл необычных современных слов

Даже если вы избегаете новых заимствований, полезно понимать, откуда взялись ретрит, косты и непо-бейбис


Функции и характерные черты публицистического стиля речи

Он предназначен для СМИ, выступлений и публицистической литературы


Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Михаил Копотев о роли сгенерированных нейросетью текстов в развитии моделей и в жизни людей


В Москве прошла первая стратегическая сессия «Информационные технологии и языки народов России»

Мероприятие организовано Домом народов России при поддержке ФАДН России


Русский язык как государственный: что означает этот статус

Когда средство общения становится символом страны и национальным достоянием



Два брата и два алфавита: история изобретения славянской письменности

Кирилл и Мефодий вместе с учениками придумали не только буквы, но и язык