Национальный словарный фонд даст пользователям больше, чем просто хорошую библиотеку словарей
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
Что такое Национальный словарный фонд: концепция и цели
Национальные словарные фонды в виде цифровой платформы под разными названиями есть во многих странах, например в Англии, в Германии. Для русского языка такой системы не было, хотя в России — и в Советском Союзе, и в дореволюционной, и в современной России — уровень лексикографической культуры очень высок, наши словари славятся, оцениваются высоко профессионалами во всем мире. Поэтому мы мечтали о таком ресурсе очень давно.
Национальный словарный фонд (НСФ) — это общедоступная государственная информационная система. Ресурс создается по поручению президента РФ при полной поддержке Совета по русскому языку при президенте. НСФ по существу представляет собой комплексный словарь, состоящий из словарей разных типов.
Система задумана как абсолютно бесплатная и свободная, в ней даже не планируется регистрация, так что ей смогут пользоваться все, от школьников до ученых.
Почему возникла идея фонда?
- Почти все словари легко купить в бумажном виде, но их покупают плохо, потому что это дорого.
- Старых словарей нигде нет, ни в интернете, ни в продаже.
- Современные словари легко найти в Сети, но в большинстве случаев это пиратская копия, отсканированная с бумажного экземпляра, плохо распознанная и с большим количеством ошибок.
Так что первое, что мы сделаем, — дадим доступ к хорошо вычитанным, выверенным словарным статьям тридцати основных словарей. Эта часть работы уже закончена, и она выполнена на очень высоком уровне. Мы не просто отсканировали словари, мы их вычитывали и выверяли с помощью специалистов: этимологические словари «чистили» этимологи, орфоэпические — специалисты в произношении, и так далее. Если бы мы остановились на этом этапе, мы получили бы просто библиотеку словарей. Это была задача-минимум.
Другая задача проекта — показать не только современную норму, но и норму в развитии. Создатели Фонда хотели отразить разные стороны функционирования норм русского языка и в современном его состоянии, и в исторической динамике. Поэтому в состав Фонда вошли лучшие образцы лексикографического жанра, созданные с XVIII века до наших дней.
Третья задача, амбициозная с научной точки зрения и трудная в исполнении, — создать инструмент пользования словарями, который позволял бы читателю извлекать из них информацию в зависимости от его запроса, смотреть на русский язык под разным углом зрения, погружаться в наш ресурс на разную глубину.
Словари в составе НСФ
Для реализации проекта при отделении историко-филологических наук Российской Академии наук был создан научный совет, куда вошли лучшие лексикографы и редакторы, те специалисты-практики, которые реально составляют и редактируют словари. Совет отобрал тридцать словарей разных типов, которые представляют то, что нам хотелось бы отразить.
Среди словарей каждого типа мы выбирали самый объемный и авторитетный. Это один из принципов отбора. Например, основной словарь среди толковых — это «Большой академический толковый словарь» в его новой версии, созданный в Институте лингвистических исследований в Петербурге.
Мы понимаем, что обычные носители языка в основном имеют дело с толковыми и орфографическими, реже орфоэпическими словарями, но разнообразие словарей не исчерпывается этим набором, и мы хотели показать это разнообразие.
Далее, мы хотели отразить жизнь языка в разные эпохи, так что включали и исторические словари, и современные. Среди исторических словарей есть словари, созданные в наше время, но описывающие прошлое состояние языка, например «Словарь древнерусского языка» или «Словарь языка Пушкина», а есть исторические словари, созданные раньше.
Одна из проблем, связанных с отнесением словарей к историческим, состояла в том, что большинство россиян считает основным и чуть ли не единственным словарем «Толковый словарь русского языка» Ожегова. Толковый словарь под редакцией Дмитрия Николаевича Ушакова тоже очень популярен. При этом оба эти словаря уже не являются словарями современного русского языка; по большому счету это исторические словари, которые показывают язык ушедшей эпохи.
Исходя из этих соображений, когда мы только начинали строить архитектуру нашей системы, мы отнесли их к историческим словарям. Но потом поняли, что никто не будет искать словарь Ожегова в разделе исторических словарей. Поэтому «Толковый словарь» Ожегова вошел в разряд современных толковых словарей, которые мы просто разделили на несколько групп: словари советской эпохи, современные и т. д.
Следующий вопрос касается литературной нормы и фиксации нормативных характеристик слова в связи с Законом о государственном языке. Мы как лингвисты понимаем, что язык постоянно меняется, особенно сейчас, и словари за ним не успевают.
Приведу два примера. Орфоэпический словарь под редакцией Рубена Ивановича Аванесова — это классика русской лексикографии, но некоторые произносительные нормы, которые в нем зафиксированы как единственно возможные, нам сейчас кажутся дикими: геликопте́р, гаста́рбайтер, фо́льга и так далее. Таких примеров сотни. Но в Фонде будут и современные орфоэпические словари, на которые можно ориентироваться сегодня.
Второй пример касается изменения значений: то, что еще вчера было единственно возможным пониманием, сегодня уже устарело. Конечно, бывают случаи, когда толкования в разных словарях расходятся из-за ошибки автора, но чаще это отражение динамики языковой действительности. Так, слово бахилы в классических словарях имеет толкование ‘высокие охотничьи сапоги’. А того значения, в котором мы знаем и употребляем это слово, там просто нет.
При этом мы не редактируем словари по существу — это принцип нашей работы. Правку мы позволяем себе только в случае явной опечатки или ошибки, когда видно, что вместо одной буквы набрана другая.
Содержание словарей не трогаем, даже если оно явно устарело с точки зрения современной науки. Каждый словарь — это не только памятник его автору, но и памятник с точки зрения языка, культуры и истории.
Вопрос «исправления» словарей встал особенно остро из-за того, что они включают не только литературную норму. В первую очередь это касается орфографического словаря под редакцией В. В. Лопатина и О. Е. Ивановой. Члены рабочей группы, которая занимается реализацией этого проекта в нашем институте, долго спорили о том, что делать с ненормативной лексикой. Предлагались разные решения, вплоть до выделения таких слов красным цветом и кнопки «осторожно, нелитературное».
В итоге мы решили ничего не делать. Это было трудное решение, я не во всем с ним согласна, но вынуждена принять мнение большинства. С одной стороны, так мы проявляем уважение к авторам словарей: разделение слов на плохие и хорошие, литературные и нелитературные было бы вмешательством в авторскую ткань словаря, а словари в такого рода ресурсе должны подаваться аутентично. С другой стороны, есть и практическое соображение: если мы начнем хоть в чем-то улучшать словари, мы не сможем остановиться.
Четыре модуля для пользователей
Палитра возможностей, которые мы закладываем в Национальный словарный фонд, обширна. Эти возможности распределены по четырем модулям.
Основной модуль. В него входит то, что в первую очередь интересует человека при обращении к словарю. Это параметры, которые лежат на поверхности языкового существования слова: как оно пишется, как произносится (включая место ударения), значение слова и формы изменения слова. Достаточно просто набрать слово, чтобы получить информацию об этих основных аспектах его функционирования. Есть также возможность обратиться к дополнительным словарям. Опция «Подробнее» позволит сравнить написание слова, ударение или его формы во всех имеющихся словарях. Параметры поиска информации устанавливает пользователь, он может из всех словарей выбрать те, которые ему нужны. Но это лишь самые поверхностные способы использования Фонда.
Расширенный модуль позволит получить информацию о гораздо большем количестве характеристик слова. Это не только написание, произношение, значение и система формообразования, но и синонимы, антонимы, омонимы, происхождение слова, особенности его сочетаемости, вхождение в фразеологизмы, и это далеко не все параметры. Этот модуль дает полную картину современного состояния лексики.
История и этимология — уникальный модуль: такого не было ни в одной системе в других странах. Мы пытаемся выстроить все, что можно получить из словарей, в диахроническом порядке, показать динамику. Одним нажатием кнопки вы сможете получить исключительно увлекательную информацию, видеть изменения слова и разные стороны его жизни в языке. Предположим, вас интересует, как менялось толкование слова. Вы выберете «толкование», выберете исторические словари (все или некоторые) и увидите, как оно употреблялось в разные эпохи и как словари это показывают.
Сопоставительный модуль — это вишенка на торте! Он позволяет задать аспект сравнения. Можно узнать, как менялось ударение или написание слова на протяжении веков или на более коротких отрезках времени. Или увидеть, в какие фразеологизмы слово входит сейчас и входило в разные периоды: то, как меняется наша жизнь, как меняются реалии, всегда отражается во фразеологии. Сравнение по разным параметрам наглядно показывает, как менялась норма.
Перспективы реализации проекта
Работа по проекту делается двумя группами специалистов, лингвистами и программистами. Лингвистическая часть — государственное задание Института, наша плановая тема, рассчитанная на 2025-2027 годы. Было бы логично, если бы программисты работали параллельно с лингвистами. Тут нужен «челночный» метод: мы ставим задачу, программисты ее решают, мы видим, что именно не получилось, переформулируем, ищем другие пути, после этого программисты опять пробуют реализовать задуманное, и так далее. Но по экономическим соображениям было решено, что программисты подключатся позже. Эта команда, в отличие от лингвистов, должна быть выбрана путем тендера, объявленного Министерством науки и высшего образования.
По предварительному плану Фонд должен был начать работу в конце 2026 года, но сроки сдвинулись. Сейчас работа программистов перенесена на 2025 год. Есть риск, что наши теоретические подходы и результаты в тот момент, когда они будут переведены на язык программирования, могут не сработать. Но мы рассчитываем и надеемся, что проект будет доведен до конца.
Текст подготовлен на основе передачи «Говорим по-русски!», которая вышла в эфир 30 октября 2023 года. «Говорим по-русски!» — совместный проект Института русского языка им. В. В. Виноградова РАН и Института Пушкина. Автор и ведущая передачи — Ольга Северская.
Еще на
эту тему
Мария Каленчук: «Нормативные рекомендации должны опираться на речевую практику образованных людей»
Что волнует русистов сегодня? Опрос Грамоты
«Говорим по-русски!»: современная лексикография
Новый выпуск программы
В России появится знак качества для словарей
Самые авторитетные издания объединят в Национальном фонде