Российские лингвисты научили алгоритм правильно «переводить» знаки препинания
Пунктуационная асимметрия — давно известная переводчикам проблема: системы знаков препинания в разных языках не совпадают ни функционально, ни стилистически. Французская пунктуация, например, традиционно более сдержанна, чем русская, где восклицательный знак может выражать не только эмоции, но и вежливость («Спасибо!», «Добрый день!»). Машинный перевод пока плохо учитывает эти тонкости, механически перенося знаки из языка в язык или теряя их.
Специалисты ФИЦ «Информатика и управление» РАН и МГУ имени М. В. Ломоносова разработали метод автоматического выявления межъязыковой асимметрии пунктуации — ситуаций, когда знаки препинания оригинала не воспроизводятся в переводе или заменяются другими. Методика получила название «поиск с исключением» и была испытана на материале параллельных русско-французских текстов.
Анализ тысяч текстовых пар показал: русский восклицательный знак при переводе на французский может превращаться в точку, запятую, вопросительный знак, многоточие, точку с запятой, двоеточие или исчезать вовсе.
Так, экспрессивное русское «адская работа!» во французском переводе может стать нейтральным «c’est un travail infernal» — с точкой. Всего исследователи зафиксировали семь основных типов замен.
Результаты исследования, опубликованные в журнале «Системы и средства информатики», имеют практическое значение для компьютерной лингвистики. Найденный метод позволяет систематизировать случаи пунктуационных расхождений и создавать обучающие датасеты для нейросетевых переводчиков. Это может повысить не только грамматическую корректность автоматических переводов, но и их естественность — способность передавать интонационные и стилистические нюансы оригинала.
Еще на
эту тему
Трудности коммуникации: как перевод влиял на ход истории
Четыре яркие истории ко Дню переводчика
Ложные друзья переводчика: когда сходство слов из разных языков может оказаться ловушкой
Почему в Англии не едят на завтрак тосты с мармеладом и не устраивают «День бокса» после Рождества
Сохранение авторского стиля при переводе: искусство грамотно спотыкаться
Как передать чужой синтаксис своими средствами, рассказывает переводчик Наталья Мавлевич