Подсказки для поиска

Русская страсть к составлению словарей: достижения прошлого и цифровое будущее

Русская страсть к составлению словарей: достижения прошлого и цифровое будущее
Иллюстрация: Тим Яржомбек

В любой библиотеке мира словари русского языка будут занимать бесконечные ряды полок. Найти можно все: от словаря языка Пушкина до словаря названий рыб. Что ждет словари в XXI веке: останутся ли они памятниками прошлого или обретут новую жизнь благодаря цифровым технологиям? Лингвист, руководитель ИИ-направления Грамоты Михаил Копотев описал для нас в общих чертах три с лишним века русской лексикографии.

Лексиконы эпохи Просвещения выражали новые понятия и идеи

Русская страсть к составлению словарей уходит корнями в интеллектуальную традицию, зародившуюся в конце XVI века. По мере того как Россия стремилась к модернизации и установлению более тесных связей с Западной Европой, возникла необходимость расширить русский лексикон, чтобы выразить новые понятия и идеи из различных областей. Петровские реформы можно рассматривать как кульминацию длительных изменений, которые проявились в том числе в лексике. 

Новое время требовало новых героев, которые описали бы приток иностранных слов.

Одним из них стал Федор Поликарпов-Орлов (ок. 1670–1731) — влиятельный ученый, чиновник при дворе Петра, проживший большую часть жизни не в столице, а в куда более консервативной Москве. Среди его основных работ — «Алфавитарь рекше букварь» (1701) и «Лексикон треязычный, сиречь речений славянских, эллино-греческих и латинских сокровищ» (1704), которые использовались в учебных заведениях на протяжении десятилетий, а также неопубликованный «Лексикон вокабулам новым по алфавиту», завершенный, как считается, в 1715 году.

Главный лексикографический труд Поликарпова-Орлова, «Трехъязычный лексикон», включает 17 328 статей, расположенных в алфавитном порядке, и дает толкования слов на трех языках: греческом, латинском и «славянском» (на самом деле это была смесь русского с церковнославянским). Словарь демонстрировал тесные отношения между восточной и западной культурами, подчеркивая, что многие понятия могут быть одинаково выражены на всех трех языках. Он должен был помочь русским интеллектуалам в переводе религиозных текстов и в общении с западноевропейскими коллегами, позволяя обсуждать достижения европейской мысли на родном языке.  

Пушкин соединил в себе два противоположных взгляда на русский язык

В начале XIX века в России возникли две принципиально разные группы мыслителей, известные как шишковисты и карамзинисты («архаисты» и «новаторы»), которые подвергли сомнению господствующую рационалистическую идеологию.

Архаисты во главе с военным и государственным деятелем Александром Шишковым стремились возродить язык и литературу Древней Руси, считая, что русский язык испорчен иностранным влиянием. Они хотели вернуться к церковнославянской письменной традиции и создать национальную литературу, отражающую национальное наследие.

В работах шишковистов часто встречались архаичные слова и формы, некоторые из них имели церковнославянское, а не восточнославянское происхождение.

Результатом их лексикографических усилий стал «Словарь Академии Российской» — первый академический словарь русского языка, шеститомный компендиум из почти 50 000 слов, опубликованный в самом конце XVIII века. Его целью была консервативная стандартизация языка путем создания четких толкований слов с примерами их употребления.

«Говорим по-русски!»: разговорные идиомы-неологизмы, слово «мир» и история «Словаря Академии Российской»О чем говорили Ольга Северская и ее гости в первом квартале 2024 годаКруг историка и писателя Николая Карамзина, напротив, стремился создать новый вариант языка, отвечающий эстетическим запросам светских образованных читателей и не в последнюю очередь — читательниц. Сам Карамзин оставил нам сентиментальные повести во французском стиле и романтизированную «Историю государства Российского». 

И архаисты, и карамзинисты внесли значительный вклад в развитие русского языка, его словарного состава, но первые были заняты его консервацией, и их фундаментальный словарь преследовал именно эти цели; вторым была чужда идея лексикографического мумифицирования живой языковой стихии.

Легкокрылый Пушкин имел отношение к обеим группам: он одним из первых был избран в члены Российской академии наук (но, по воспоминаниям, манкировал своим участием в составлении академического словаря) и при этом активно модернизировал русский язык в своей поэтической практике. Степень его языкового новаторства сравнима со злободневным остроумием Пелевина:

Но панталоны, фрак, жилет, 
Всех этих слов на русском нет;
А вижу я, винюсь пред вами,
Что уж и так мой бедный слог
Пестреть гораздо б меньше мог
Иноплеменными словами,
Хоть и заглядывал я встарь
В Академический словарь. 

Homo homini lupus est — гласит один крылатый
латинизм. Но человек человеку уже давно не волк.
Человек человеку даже не имиджмейкер, не дилер,
не киллер и не эксклюзивный дистрибьютор, как
предполагают современные социологи. Всё гораздо
страшнее и проще. Человек человеку вау —
и не человеку, а такому же точно вау. Так что
в проекции на современную систему культурных
координат это латинское изречение звучит так:
Вау Вау Вау! 

А. С. Пушкин. Евгений Онегин  В. О. Пелевин. Generation P

Спор архаистов и новаторов в словарном деле продолжился: в 1847 году выходит «Словарь церковнославянского и русского языка» Академии наук, в 1860-е — «Толковый словарь живого великорусского языка» Владимира Даля. Создание академического словаря финансировала казна, в то время как для Даля словарь стал делом всей жизни (читай, «хобби»), которое только после публикации принесло автору заслуженные почести. 

И само название словаря Даля (живой язык!), и его популярность вплоть до наших дней говорят о том, что его подход оказался более перспективным. Новаторский словарь стремился дать исчерпывающее объяснение значений практически всех русских слов, отразить богатое разнообразие диалектов. Он включал более двухсот тысяч статей с подробными описаниями, примерами употребления и этимологическими сведениями. Правда, Даль не смущался добавлять придуманные слова… 

Советские словарные проекты были подчинены идеологии, но иногда шли против течения

Видимо, в силу своей «народности» словарь Даля был минимально искажен советской цензурой, поэтому на протяжении десятилетий оставался символом «чистого», «старинного» языка и стоял на полке в каждой интеллигентной семье. Неудивительно, что Александр Солженицын при создании своего «Русского словаря языкового расширения» в значительной степени опирался на Даля. 

Тем временем новая советская лексикография развивала традиции дореволюционной Академии.  

«Толковый словарь русского языка» Ушакова в четырех томах — один из самых полных словарей советского времени: его отличает большой охват лексики, в нем есть многие архаичные и диалектные слова.

Изданный в 1935–1940 годах, словарь, конечно, отражает советскую практику — в толкованиях упор делается на идеологическое объяснение. Это видно, например, в статье «Символизм», где второе значение сформулировано так: «Направление в искусстве конца 19 и начала 20 вв., выражавшее упадочнические реакционные настроения буржуазии, в художественных образах создававшее символы мистических переживаний и представлений (лит., искус.)». 

«Посмотреть в Ушакове», или Как человек становится словаремЛекция доктора филологических наук Евгении Наумовны БасовскойСоциально-экономическим фоном для появления в СССР большого количества словарей стали массовая внутренняя миграция населения, урбанизация и технический прогресс. Эти факторы выдвинули на первый план людей с разным языковым опытом, зачастую не владевших специальной терминологией. При этом советская лексикографическая (равно как и педагогическая) практика основывалась на теории литературного языка, который понимался как «высшая форма существования языка». Эта теория предполагала создание директивных словарей, адресованных разным социальным группам — от школьников до носителей иностранного языка.

В то же время даже в условиях идеологических ограничений разрабатывались словари, построенные на новаторской теоретической базе.

Эти словари не были массовыми, но внесли значительный вклад в мировую лингвистику. Яркий пример такой работы — «Толково-комбинаторный словарь современного русского языка: опыты семантико-синтаксического описания русской лексики» (1984) под редакцией Игоря Мельчука и Александра Жолковского. Значение этого словаря намного превосходит его скромный объем (всего 282 статьи).

Во-первых, в его основе лежит теоретическая модель «Смысл — текст», предполагающая целостное описание слов, в том числе морфологическую, семантическую, стилистическую и идиоматическую информацию, а также энциклопедические сведения, необходимые для правильного употребления каждого слова. 

Во-вторых, в нем используется понятие лексической функции, которое позволяет описать глубокие семантические отношения между лексемами. Например, лексическая функция Magn ‘в очень высокой степени’ для разных существительных имеет разные реализации-прилагательные:  Magn (болезнь) = тяжелая, Magn (дождь) = проливной, Magn (радость) = огромная.

Еще один выдающийся труд — «Грамматический словарь русского языка», составленный Андреем Зализняком и опубликованный в 1974 году. Его тоже трудно назвать массовым. Слова в нем расположены в обратном алфавитном порядке, и для каждого слова указаны тип склонения и ударения, что позволяет автоматически генерировать все формы слова. Словарь Зализняка был весьма впечатляющим достижением отечественной лексикографии, учитывая сложность русской морфологии и отсутствие персональных компьютеров в то время.

Сегодня русская лексикография включает прескриптивное (предписывающее) и дескриптивное (описывающее) направления, которые реализуют разные подходы к словарному представлению лексики.

Первый подход поддерживается заинтересованностью государства в контроле над языком, которая затрагивает и словари. Так, принятый в 2005 году Закон о государственном языке установил, что языковые нормы фиксируются, помимо прочих источников, в нормативных словарях. Удивительно, что новаторский на момент появления «Грамматический словарь» выглядит в списке нормативных словарей таким же устаревшим, как и словарь Даля на полке советского интеллигента.

Второе направление сочетает фундаментальные достижения советской эпохи с передовыми информационными технологиями, основанными на больших коллекциях реальных языковых данных. В рамках этого подхода создается большинство академических словарей. «Активный словарь русского языка» под редакцией Юрия Апресяна даже в своем названии перекликается с «живым языком» Даля.

Цифровые технологии стремительно меняют будущее лексикографии

В последние десятилетия использование традиционных бумажных словарей сокращается: они занимают много места на полке и неудобны для поиска. В то же время электронные словари процветают; преимущества электронного формата сделали их основным источником словарной информации. В этом направлении развивается Метасловарь Грамоты, который объединяет различные лексикографические ресурсы в единую, удобную и интерактивно связанную систему. А с 2024 года Грамота начала включать в Метасловарь новейшую лексику, которая не представлена ни в одном словаре. 

Еще одно новшество — современные языковые модели, которые обучаются на огромных массивах текстов и анализируют закономерности употребления слов. Большие языковые модели открывают новые перспективы для автоматизированного обновления словарей, создания более точных описаний значений слов и учета их актуального употребления в различных контекстах. И хотя критики считают, что модели вроде ChatGPT на самом деле не понимают язык и лишь комбинируют известные шаблоны, их способность обращаться к гигантским объемам данных в реальном времени делает их все более заметным игроком и на поле реального языкового опыта, и на поле его лексикографической фиксации.

Как искусственный интеллект изменит возможности ГрамотыУмный поиск, обновленная Справка и текстовый робот-ассистентС одной стороны, новые технологии предоставляют равный доступ к языку и тем, кто не владеет им на достаточном уровне, например мигрантам или носителям унаследованного языка. С другой — с развитием технологий значительно увеличивается количество текстов, которые будут менять языковую реальность. С точки зрения языковой политики это свидетельствует об уменьшении роли институтов в процессе кодификации языка.

Языковые модели следуют статистическим закономерностям языка, а не предписанным нормам, будь они сверхконсервативными или в высшей степени инновационными.

Развитие технологий принципиально меняет восприятие языковых норм: они становятся более гибкими, вероятностными, зависимыми от узуса, что позволяет говорить о постепенном ослаблении прескриптивных установок в лексикографии. Этот процесс связан с развитием корпусной лингвистики — прежде всего Национального корпуса русского языка, который способствовал переходу от нормативного подхода к анализу и описанию языковых данных.

Изменения затронули и Грамоту. Портал всегда был ориентирован на предоставление сведений об устоявшихся, проверенных языковых нормах журналистам, редакторам, преподавателям, а затем и широкой аудитории. Однако начиная с 2024 года некоторые его материалы, включая словарные определения новых слов и словоизменительные парадигмы, частично генерируются ИИ с последующей проверкой специалистами.

История лексикографии — это история борьбы между предписанием и описанием, между нормативностью и вариативностью, прошлым и будущим.

Академические словари и в XIX, и в XX веке были направлены на фиксацию строгих норм, отражающих государственные представления о правильном языке. При этом история лексикографии знает и альтернативные подходы, описывающие язык в его реальном употреблении.

Заглядывая в будущее лексикографии, я представляю себе многомерные базы данных. Они будут не только предлагать полное семантическое описание каждого слова, но и включать информацию о конструкциях, фразеологии, семантических тонкостях, показывать статистику использования слова в режиме реального времени. По сути эта будущая система выйдет за рамки толкования слов и превратится в интерактивный информационный портал, прототип которого мы уже видим на сайте НКРЯ в виджете «Портрет слова». Этот формат будет кардинально отличаться от традиционных бумажных изданий. Но будет ли эта информационная система по-прежнему называться словарем?

Статья подготовлена по материалам интервью, которое автор дал Илану Стэвансу для издания «Беседы о словарях: Вселенная в книге» (Stavans I. Conversations on Dictionaries: The Universe in a Book. Cambridge University Press, 2025).

· руководитель ИИ-направления Грамоты, кандидат филологических наук, PhD

Еще на эту тему

Как история языка разрешила спор Шишкова и Карамзина? Рассказывает филолог Юрий Кагарлицкий

Слово «трогательный» осталось в русском языке вопреки логике

К двухсотлетию со дня рождения Владимира Ивановича Даля

«Язык народа, бесспорно, главнейший и неисчерпаемый родник или рудник наш...»

Авторская лексикография в отечественном языкознании

Словари языка писателей и других авторов можно классифицировать на основе десяти признаков

все публикации

Елочки или лапки? Как правильно использовать кавычки

Они нужны для оформления прямой речи, цитат, названий, а также слов, использованных иронически

Мария Каленчук: «Да, мы ориентируемся на живую речь!»

В издательстве «Грамота» вышел Большой словарь ударений

Кто эффективнее в изучении языка — человек или нейросеть?

«Язык опирается на врожденную систему знаний», — объясняет лингвист Наталия Слюсарь

Не только люди: с кем еще мы разговариваем по душам?

Лингвист Валерий Шульгинов напоминает, что до появления чат-ботов люди охотно общались со стихиями, куклами и техникой

Нейтральный язык эсперанто: благородная попытка объединить человечество

Был ли шанс у этого проекта, на который доктор Заменгоф потратил многие годы?

Что было написано на яблоке раздора? Тест на знание истории крылатых слов

Часто мы используем устойчивые выражения, точный смысл которых от нас ускользает

Как пишутся сложные топонимы: правила и исключения

Ново-Огарево отличается от Новосибирска, как Соль-Илецк от Сольвычегодска

Попадает в самое сердечко... Почему теперь так говорят?

Лингвист Ирина Фуфаева ищет причины экспансии этого диминутива в современной речи

Лингвист Борис Орехов: «Корпус русской классики дает доступ в языковую лабораторию авторов»

В Национальном корпусе русского языка теперь можно изучать и сравнивать языки писателей XIX века

Всё о чувствах и отношениях: почему язык психологии стал так популярен

Лингвисты, социологи и психологи обсуждают вред и пользу психотерапевтической волны в русском языке

Запретные слова: что думают лингвисты о нецензурной лексике как части русского языка

В издательстве МИФ вышла научно-популярная книга двух докторов филологических наук

«Слова года» полгода спустя: кто продолжает забег

Насколько точным был прошлогодний выбор Грамоты и как чувствуют себя «наши» неологизмы сегодня

Как устроены языковые манипуляции

Эти приемы используют публицисты, политики, телефонные мошенники и даже родственники

Что значит это региональное слово?

Не только «поребрик» и «мультифора» выдают малую родину говорящего

Высок как гора, застенчив как барышня: что фразеология сообщает о культурно-языковой картине мире

Лингвокультуролог Мария Ковшова о разных способах символизации реальности

Таджики, негры и евреи: что исследует лингвистическая конфликтология

Сотрудники НИУ ВШЭ рассказали коллегам об этом научном направлении и о результатах своих экспериментов

Как склонять по-русски составные топонимы

В зависимости от происхождения и структуры могут склоняться обе части названия, одна из частей или ни одной

Слова-паразиты: откуда они берутся и какую роль выполняют

Они приходят без разрешения и «питаются» смыслом высказывания

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!