Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Как искусственный интеллект изменит возможности Грамоты

Как искусственный интеллект изменит возможности Грамоты

Сервисы обновленной Грамоты становятся более технологичными. Например, в них будут применяться нейронные сети. Руководитель ИИ-направления, компьютерный лингвист Михаил Копотев рассказал про основные направления работы и возможности новых технологий.

Грамота: Что изменится для пользователей в результате появления на портале искусственного интеллекта?

Михаил Копотев: Когда задумывалось обновление Грамоты, у команды было несколько основных задач. Одна из них — создание площадки, которая будет помогать пользователям работать с русским текстом. Было очевидно, что тех технологий, которые есть в существующих языковых сервисах, часто недостаточно для решения задач пользователя. Тогда ChatGPT еще не был публично доступен, но уже было понятно, что нас ждет много изменений.

Именно поэтому на Грамоте был создан отдел искусственного интеллекта. Мы работаем над несколькими новыми инструментами, которые помогут решать и совсем простые задачи, и более сложные.

Первое нововведение — это интеллектуальный поиск. Мы хотели не просто искать слово или фразу по всем разделам Грамоты, а понимать, в чем смысл запроса пользователя, какую именно информацию он ищет в данном случае. 

Возьмем стандартные запросы на Грамоте: как правильно риелтер или риелтор, в чем разница компания или кампания. Нам как специалистам важно понять, что пользователя не интересуют слова «как правильно», не они являются предметом его запроса — этими словами он обращается к сотрудникам Справки и дает понять, что его интересует правописание (в первом случае) и значение (во втором). С другой стороны, нужное ему слово, например риелтор, может быть написано с ошибкой — именно для того, чтобы этой ошибки избежать, пользователь и пришел на сайт Грамоты.

Новая система поиска позволяет отсечь информационный шум, выделить ту часть запроса, которая отражает задачу пользователя, и подобрать лучший ответ с учетом возможных вариантов написания. Обычный поисковый алгоритм такие задачи не решает и решать не должен.

Второе направление — это подключение ИИ к одному из наших самых востребованных ресурсов — к Справке. Сейчас над ответами справочной службы Грамоты трудятся профессиональные лингвисты во главе с Еленой Арутюновой. За годы работы команда Справки ответила на сотни тысяч вопросов — это бесценная коллекция знаний о русском языке. Мы собираемся сделать работу с этими материалами более технологичной.

Каким образом? Вы имеете в виду поиск по уже имеющимся ответам? Вряд ли алгоритм сможет отвечать на вопросы вместо лингвистов.

М. К.: Интеллектуальная система будет вступать в роли помощника лингвистов и создавать  шаблоны ответов на стандартные вопросы. Конечно, такой помощник не сможет предложить ответ на сложный или нестандартный вопрос, например не сумеет разобрать слово по составу или изложить всю историю происхождения какого-то выражения. Но для множества частотных и простых по сути запросов он существенно ускорит и упростит работу сотрудников Справки. Естественно, лингвисты будут проверять все созданные автоматически ответы, но им не придется писать их от начала до конца. Вместо этого они смогут сосредоточиться на более каверзных и сложных вопросах.

Мы надеемся, что сочетание профессиональной экспертности и машинной генерации увеличит скорость работы сервиса и сократит нагрузку на специалистов, связанную с набором и копированием текста ответов. В этом заключается один из принципов новой Грамоты: сочетание традиционного качества экспертизы и современных технологических решений.

Вы рассказали о ближайших изменениях, которые появятся прямо сейчас или в обозримом будущем. А как вы видите перспективы развития Грамоты? Над какими масштабными решениями вы работаете?

М. К.: Глобальная цель на ближайшие годы — создание текстового помощника. Этот сервис будет использовать и все преимущества современных языковых моделей, и мощь лексикографической и орфографической традиции, накопленной Грамотой.

Например, словари на Грамоте хранятся в очень удобной форме, которую легко интегрировать в систему автоматической проверки текстов — и это даст колоссальное улучшение качества. Допустим, вы создаете текст и хотите подобрать синонимы. С помощью словарей мы можем получить точный, но неполный список, а с помощью языковых моделей — более обширный, но менее точный. Сочетание того и другого способа даст более качественный результат, который будет полезен при работе над текстом. Это один из примеров того, на каких принципах мы создаем новый сервис.

Другой пример — проверка орфографии. Существующие спеллчекеры хорошо обрабатывают ошибки и опечатки вроде *карова, когда слово есть в словаре или его правописание регулируется однозначным правилом. Но в русском языке множество правил, которые устроены гораздо тоньше. Например, запятая перед «как», н/нн в суффиксах прилагательных и причастий и множество других. В таких случаях применение правил вызывает затруднения даже у грамотных людей и тем более при автоматической проверке. Машинное обучение поможет решить эту проблему.

Одно из достоинств больших языковых моделей состоит в том, что они сравнивают пользовательский документ с большим объемом существующих текстов и подсказывают правильный ответ исходя из статистической вероятности. Например, они могут сообщить, что похожие контексты содержат в этом случае запятую с вероятностью 100%, 80% или 30%.

Подобные сервисы наверняка уже существуют для английского, возможно, они есть и для других языков. Какие из них кажутся вам наиболее удачными, на что вы ориентируетесь?

М. К.: Таких сервисов множество. Пожалуй, самый известный из них — Grammarly. Он возник как простой спеллчекер для тех, кто пишет на английском, не будучи носителем этого языка. Сейчас это мощный и удобный текстовый помощник, который использует самые современные языковые модели. Теперь он не просто исправляет опечатки, но и предлагает более удачные формулировки и даже исправляет стиль документа.

Второй крупный игрок на этом рынке — компания Microsoft, которая разработала ChatGPT и интегрировала в свои приложения сервис Copilot. Мне нравится это название — «Второй пилот»: в нем скрывается метафора незаменимого помощника, который всегда на вторых ролях, но без которого трудно двигаться на современных скоростях. Этот сервис будет готовить для нас черновики писем, переводить документы на разные языки и, может быть, даже поможет с выполнением домашнего задания.

Как все это можно будет применять на практике для работы с русским языком?

М. К.: Конечно, можно ожидать, что новый сервис Грамоты будет востребован всеми, кто так или иначе работает с текстом: журналистами, редакторами, учителями… Но я вижу и более широкие задачи, которые позволяют облегчить жизнь людям в ситуациях, когда успешность их действий зависит от уровня владения языком.

Возьмем, например, мигрантов, которые владеют устной формой языка, но с письменной, особенно с бюрократической, у них возникают проблемы. В любом официальном учреждении такой человек сталкивается с трудностями, а часто и с откровенной дискриминацией. Наш текстовый помощник поможет такому клиенту правильно написать заявление или переведет текст с бюрократического на русский.

Это демократизация доступа к языку, которая помогает во взаимодействии с теми службами, где требуется знание языка.

Или другой пример: в любой большой компании есть документооборот, для которого существуют гласные или негласные правила. Например, какое-то технологическое явление или процесс принято называть определенным образом. Наш сервис при дополнительном обучении позволит работникам использовать терминологию так, чтобы тексты компании были унифицированы. Это уже трудно назвать спеллчекером, это именно интеллектуальный помощник.

, редактор Грамоты

Еще на эту тему

Изучение русского языка: чем поможет Грамота

Руководитель образовательного направления Мария Лебедева делится идеями и планами

Чат-боты GPT и другие: что думают лингвисты о больших языковых моделях

Впереди демократизация порождения текстов и большие риски злоупотреблений

Семь современных «учебников» для тех, кто пишет и редактирует

Стандарты, кейсы и профессиональные приемы, которым вряд ли научат в вузе

все публикации

Тест: что вы знаете о словарях?

Вы наверняка в курсе, где посмотреть правильное ударение и как выяснить значение непонятного слова. Но проверить себя всё равно не помешает!




Коллекция «ПостНауки»: сколько в мире языков и какие самые сложные

Мнение лингвистов о языковом разнообразии, двух типах исследователей и пользе мертвых языков


Слово года по версии Грамоты. Как мы его выбираем?

От составления длинного списка до экспертного голосования


Как вы пользуетесь Грамотой? Пять рассказов от первого лица

Порталу исполняется 24 года! Отмечаем день рождения вместе с вами


Лингвист Олег Беляев об истории осетинского языка и его особенностях

«Один раз выучил окончание и везде его ставишь — это называется агглютинация»


Тест: в каком предложении нет ни одной ошибки?

Вам предстоит критически оценить сорок предложений из художественной литературы и найти десять безупречных


Категория рода в русской грамматике в сравнении с другими языками

«Лосось», «лебедь», «дитя», «невежда» и другие языковые сущности сложной судьбы


Пол Грэм: «Мир, разделенный на пишущих и не пишущих, опаснее, чем кажется»

Программист и предприниматель Пол Грэм описал будущее, в котором ИИ пишет тексты за человека


Слова-путешественники: каким образом русские слова оказались вдали от России

И насколько эти заимствования были изначально русскими? Разбирается лингвист Мария Елифёрова


Метапредметный подход в обучении русскому языку: один за всех, все за одного

Без знания лексики и умения извлекать смысл из текста страдают математика и другие школьные предметы


Словарный запас: как его оценить и на что он влияет

Хорошая новость состоит в том, что взрослые продолжают его расширять до 55 лет и даже дольше


Елена Березович: «Диалектологам становится все труднее работать»

Профессор Уральского университета обобщила результаты анкетирования коллег 


Учитель Сергей Волков: «А давайте сказку про репку перескажем гекзаметром!»

Как учить детей русскому языку в эпоху торжества технологий и сглаживания иерархии культур



О чем мы можем узнать из средневековых рукописных текстов

Интервью с медиевистом Олегом Воскобойниковым на канале «Основа»


Как лучше описывать разговорную лексику в словарях

Лингвисты обсуждают проблемы лексикографического представления диалектизмов, регионализмов, феминитивов и «жестовых» слов


Как лингвистическая экспертиза может повысить качество учебников

Главные критерии — понятность, интересность и тематический баланс


Общение в интернете происходит на особом устно-письменном языке

Его отличия от разговорного языка и от обычного письменного анализируются в статье Натальи Клушиной


1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!