Русская страсть к составлению словарей: достижения прошлого и цифровое будущее

В любой библиотеке мира словари русского языка будут занимать бесконечные ряды полок. Найти можно все: от словаря языка Пушкина до словаря названий рыб. Что ждет словари в XXI веке: останутся ли они памятниками прошлого или обретут новую жизнь благодаря цифровым технологиям? Лингвист, руководитель ИИ-направления Грамоты Михаил Копотев описал для нас в общих чертах три с лишним века русской лексикографии.
Лексиконы эпохи Просвещения выражали новые понятия и идеи
Русская страсть к составлению словарей уходит корнями в интеллектуальную традицию, зародившуюся в конце XVI века. По мере того как Россия стремилась к модернизации и установлению более тесных связей с Западной Европой, возникла необходимость расширить русский лексикон, чтобы выразить новые понятия и идеи из различных областей. Петровские реформы можно рассматривать как кульминацию длительных изменений, которые проявились в том числе в лексике.
Новое время требовало новых героев, которые описали бы приток иностранных слов.
Одним из них стал Федор Поликарпов-Орлов (ок. 1670–1731) — влиятельный ученый, чиновник при дворе Петра, проживший большую часть жизни не в столице, а в куда более консервативной Москве. Среди его основных работ — «Алфавитарь рекше букварь» (1701) и «Лексикон треязычный, сиречь речений славянских, эллино-греческих и латинских сокровищ» (1704), которые использовались в учебных заведениях на протяжении десятилетий, а также неопубликованный «Лексикон вокабулам новым по алфавиту», завершенный, как считается, в 1715 году.
Главный лексикографический труд Поликарпова-Орлова, «Трехъязычный лексикон», включает 17 328 статей, расположенных в алфавитном порядке, и дает толкования слов на трех языках: греческом, латинском и «славянском» (на самом деле это была смесь русского с церковнославянским). Словарь демонстрировал тесные отношения между восточной и западной культурами, подчеркивая, что многие понятия могут быть одинаково выражены на всех трех языках. Он должен был помочь русским интеллектуалам в переводе религиозных текстов и в общении с западноевропейскими коллегами, позволяя обсуждать достижения европейской мысли на родном языке.
Пушкин соединил в себе два противоположных взгляда на русский язык
В начале XIX века в России возникли две принципиально разные группы мыслителей, известные как шишковисты и карамзинисты («архаисты» и «новаторы»), которые подвергли сомнению господствующую рационалистическую идеологию.
Архаисты во главе с военным и государственным деятелем Александром Шишковым стремились возродить язык и литературу Древней Руси, считая, что русский язык испорчен иностранным влиянием. Они хотели вернуться к церковнославянской письменной традиции и создать национальную литературу, отражающую национальное наследие.
В работах шишковистов часто встречались архаичные слова и формы, некоторые из них имели церковнославянское, а не восточнославянское происхождение.
Результатом их лексикографических усилий стал «Словарь Академии Российской» — первый академический словарь русского языка, шеститомный компендиум из почти 50 000 слов, опубликованный в самом конце XVIII века. Его целью была консервативная стандартизация языка путем создания четких толкований слов с примерами их употребления.
«Говорим по-русски!»: разговорные идиомы-неологизмы, слово «мир» и история «Словаря Академии Российской»О чем говорили Ольга Северская и ее гости в первом квартале 2024 годаКруг историка и писателя Николая Карамзина, напротив, стремился создать новый вариант языка, отвечающий эстетическим запросам светских образованных читателей и не в последнюю очередь — читательниц. Сам Карамзин оставил нам сентиментальные повести во французском стиле и романтизированную «Историю государства Российского».
И архаисты, и карамзинисты внесли значительный вклад в развитие русского языка, его словарного состава, но первые были заняты его консервацией, и их фундаментальный словарь преследовал именно эти цели; вторым была чужда идея лексикографического мумифицирования живой языковой стихии.
Легкокрылый Пушкин имел отношение к обеим группам: он одним из первых был избран в члены Российской академии наук (но, по воспоминаниям, манкировал своим участием в составлении академического словаря) и при этом активно модернизировал русский язык в своей поэтической практике. Степень его языкового новаторства сравнима со злободневным остроумием Пелевина:
Но панталоны, фрак, жилет, Всех этих слов на русском нет; А вижу я, винюсь пред вами, Что уж и так мой бедный слог Пестреть гораздо б меньше мог Иноплеменными словами, Хоть и заглядывал я встарь В Академический словарь. |
Homo homini lupus est — гласит один крылатый |
А. С. Пушкин. Евгений Онегин | В. О. Пелевин. Generation P |
Спор архаистов и новаторов в словарном деле продолжился: в 1847 году выходит «Словарь церковнославянского и русского языка» Академии наук, в 1860-е — «Толковый словарь живого великорусского языка» Владимира Даля. Создание академического словаря финансировала казна, в то время как для Даля словарь стал делом всей жизни (читай, «хобби»), которое только после публикации принесло автору заслуженные почести.
И само название словаря Даля (живой язык!), и его популярность вплоть до наших дней говорят о том, что его подход оказался более перспективным. Новаторский словарь стремился дать исчерпывающее объяснение значений практически всех русских слов, отразить богатое разнообразие диалектов. Он включал более двухсот тысяч статей с подробными описаниями, примерами употребления и этимологическими сведениями. Правда, Даль не смущался добавлять придуманные слова…
Советские словарные проекты были подчинены идеологии, но иногда шли против течения
Видимо, в силу своей «народности» словарь Даля был минимально искажен советской цензурой, поэтому на протяжении десятилетий оставался символом «чистого», «старинного» языка и стоял на полке в каждой интеллигентной семье. Неудивительно, что Александр Солженицын при создании своего «Русского словаря языкового расширения» в значительной степени опирался на Даля.
Тем временем новая советская лексикография развивала традиции дореволюционной Академии.
«Толковый словарь русского языка» Ушакова в четырех томах — один из самых полных словарей советского времени: его отличает большой охват лексики, в нем есть многие архаичные и диалектные слова.
Изданный в 1935–1940 годах, словарь, конечно, отражает советскую практику — в толкованиях упор делается на идеологическое объяснение. Это видно, например, в статье «Символизм», где второе значение сформулировано так: «Направление в искусстве конца 19 и начала 20 вв., выражавшее упадочнические реакционные настроения буржуазии, в художественных образах создававшее символы мистических переживаний и представлений (лит., искус.)».
«Посмотреть в Ушакове», или Как человек становится словаремЛекция доктора филологических наук Евгении Наумовны БасовскойСоциально-экономическим фоном для появления в СССР большого количества словарей стали массовая внутренняя миграция населения, урбанизация и технический прогресс. Эти факторы выдвинули на первый план людей с разным языковым опытом, зачастую не владевших специальной терминологией. При этом советская лексикографическая (равно как и педагогическая) практика основывалась на теории литературного языка, который понимался как «высшая форма существования языка». Эта теория предполагала создание директивных словарей, адресованных разным социальным группам — от школьников до носителей иностранного языка.
В то же время даже в условиях идеологических ограничений разрабатывались словари, построенные на новаторской теоретической базе.
Эти словари не были массовыми, но внесли значительный вклад в мировую лингвистику. Яркий пример такой работы — «Толково-комбинаторный словарь современного русского языка: опыты семантико-синтаксического описания русской лексики» (1984) под редакцией Игоря Мельчука и Александра Жолковского. Значение этого словаря намного превосходит его скромный объем (всего 282 статьи).
Во-первых, в его основе лежит теоретическая модель «Смысл — текст», предполагающая целостное описание слов, в том числе морфологическую, семантическую, стилистическую и идиоматическую информацию, а также энциклопедические сведения, необходимые для правильного употребления каждого слова.
Во-вторых, в нем используется понятие лексической функции, которое позволяет описать глубокие семантические отношения между лексемами. Например, лексическая функция Magn ‘в очень высокой степени’ для разных существительных имеет разные реализации-прилагательные: Magn (болезнь) = тяжелая, Magn (дождь) = проливной, Magn (радость) = огромная.
Еще один выдающийся труд — «Грамматический словарь русского языка», составленный Андреем Зализняком и опубликованный в 1974 году. Его тоже трудно назвать массовым. Слова в нем расположены в обратном алфавитном порядке, и для каждого слова указаны тип склонения и ударения, что позволяет автоматически генерировать все формы слова. Словарь Зализняка был весьма впечатляющим достижением отечественной лексикографии, учитывая сложность русской морфологии и отсутствие персональных компьютеров в то время.
Сегодня русская лексикография включает прескриптивное (предписывающее) и дескриптивное (описывающее) направления, которые реализуют разные подходы к словарному представлению лексики.
Первый подход поддерживается заинтересованностью государства в контроле над языком, которая затрагивает и словари. Так, принятый в 2005 году Закон о государственном языке установил, что языковые нормы фиксируются, помимо прочих источников, в нормативных словарях. Удивительно, что новаторский на момент появления «Грамматический словарь» выглядит в списке нормативных словарей таким же устаревшим, как и словарь Даля на полке советского интеллигента.
Второе направление сочетает фундаментальные достижения советской эпохи с передовыми информационными технологиями, основанными на больших коллекциях реальных языковых данных. В рамках этого подхода создается большинство академических словарей. «Активный словарь русского языка» под редакцией Юрия Апресяна даже в своем названии перекликается с «живым языком» Даля.
Цифровые технологии стремительно меняют будущее лексикографии
В последние десятилетия использование традиционных бумажных словарей сокращается: они занимают много места на полке и неудобны для поиска. В то же время электронные словари процветают; преимущества электронного формата сделали их основным источником словарной информации. В этом направлении развивается Метасловарь Грамоты, который объединяет различные лексикографические ресурсы в единую, удобную и интерактивно связанную систему. А с 2024 года Грамота начала включать в Метасловарь новейшую лексику, которая не представлена ни в одном словаре.
Еще одно новшество — современные языковые модели, которые обучаются на огромных массивах текстов и анализируют закономерности употребления слов. Большие языковые модели открывают новые перспективы для автоматизированного обновления словарей, создания более точных описаний значений слов и учета их актуального употребления в различных контекстах. И хотя критики считают, что модели вроде ChatGPT на самом деле не понимают язык и лишь комбинируют известные шаблоны, их способность обращаться к гигантским объемам данных в реальном времени делает их все более заметным игроком и на поле реального языкового опыта, и на поле его лексикографической фиксации.
Как искусственный интеллект изменит возможности ГрамотыУмный поиск, обновленная Справка и текстовый робот-ассистентС одной стороны, новые технологии предоставляют равный доступ к языку и тем, кто не владеет им на достаточном уровне, например мигрантам или носителям унаследованного языка. С другой — с развитием технологий значительно увеличивается количество текстов, которые будут менять языковую реальность. С точки зрения языковой политики это свидетельствует об уменьшении роли институтов в процессе кодификации языка.
Языковые модели следуют статистическим закономерностям языка, а не предписанным нормам, будь они сверхконсервативными или в высшей степени инновационными.
Развитие технологий принципиально меняет восприятие языковых норм: они становятся более гибкими, вероятностными, зависимыми от узуса, что позволяет говорить о постепенном ослаблении прескриптивных установок в лексикографии. Этот процесс связан с развитием корпусной лингвистики — прежде всего Национального корпуса русского языка, который способствовал переходу от нормативного подхода к анализу и описанию языковых данных.
Изменения затронули и Грамоту. Портал всегда был ориентирован на предоставление сведений об устоявшихся, проверенных языковых нормах журналистам, редакторам, преподавателям, а затем и широкой аудитории. Однако начиная с 2024 года некоторые его материалы, включая словарные определения новых слов и словоизменительные парадигмы, частично генерируются ИИ с последующей проверкой специалистами.
История лексикографии — это история борьбы между предписанием и описанием, между нормативностью и вариативностью, прошлым и будущим.
Академические словари и в XIX, и в XX веке были направлены на фиксацию строгих норм, отражающих государственные представления о правильном языке. При этом история лексикографии знает и альтернативные подходы, описывающие язык в его реальном употреблении.
Заглядывая в будущее лексикографии, я представляю себе многомерные базы данных. Они будут не только предлагать полное семантическое описание каждого слова, но и включать информацию о конструкциях, фразеологии, семантических тонкостях, показывать статистику использования слова в режиме реального времени. По сути эта будущая система выйдет за рамки толкования слов и превратится в интерактивный информационный портал, прототип которого мы уже видим на сайте НКРЯ в виджете «Портрет слова». Этот формат будет кардинально отличаться от традиционных бумажных изданий. Но будет ли эта информационная система по-прежнему называться словарем?
Статья подготовлена по материалам интервью, которое автор дал Илану Стэвансу для издания «Беседы о словарях: Вселенная в книге» (Stavans I. Conversations on Dictionaries: The Universe in a Book. Cambridge University Press, 2025).
Еще на
эту тему
Как история языка разрешила спор Шишкова и Карамзина? Рассказывает филолог Юрий Кагарлицкий
Слово «трогательный» осталось в русском языке вопреки логике
К двухсотлетию со дня рождения Владимира Ивановича Даля
«Язык народа, бесспорно, главнейший и неисчерпаемый родник или рудник наш...»
Авторская лексикография в отечественном языкознании
Словари языка писателей и других авторов можно классифицировать на основе десяти признаков