Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Русская страсть к составлению словарей: достижения прошлого и цифровое будущее

Русская страсть к составлению словарей: достижения прошлого и цифровое будущее
Иллюстрация: Тим Яржомбек

В любой библиотеке мира словари русского языка будут занимать бесконечные ряды полок. Найти можно все: от словаря языка Пушкина до словаря названий рыб. Что ждет словари в XXI веке: останутся ли они памятниками прошлого или обретут новую жизнь благодаря цифровым технологиям? Лингвист, руководитель ИИ-направления Грамоты Михаил Копотев описал для нас в общих чертах три с лишним века русской лексикографии.

Лексиконы эпохи Просвещения выражали новые понятия и идеи

Русская страсть к составлению словарей уходит корнями в интеллектуальную традицию, зародившуюся в конце XVI века. По мере того как Россия стремилась к модернизации и установлению более тесных связей с Западной Европой, возникла необходимость расширить русский лексикон, чтобы выразить новые понятия и идеи из различных областей. Петровские реформы можно рассматривать как кульминацию длительных изменений, которые проявились в том числе в лексике. 

Новое время требовало новых героев, которые описали бы приток иностранных слов.

Одним из них стал Федор Поликарпов-Орлов (ок. 1670–1731) — влиятельный ученый, чиновник при дворе Петра, проживший большую часть жизни не в столице, а в куда более консервативной Москве. Среди его основных работ — «Алфавитарь рекше букварь» (1701) и «Лексикон треязычный, сиречь речений славянских, эллино-греческих и латинских сокровищ» (1704), которые использовались в учебных заведениях на протяжении десятилетий, а также неопубликованный «Лексикон вокабулам новым по алфавиту», завершенный, как считается, в 1715 году.

Главный лексикографический труд Поликарпова-Орлова, «Трехъязычный лексикон», включает 17 328 статей, расположенных в алфавитном порядке, и дает толкования слов на трех языках: греческом, латинском и «славянском» (на самом деле это была смесь русского с церковнославянским). Словарь демонстрировал тесные отношения между восточной и западной культурами, подчеркивая, что многие понятия могут быть одинаково выражены на всех трех языках. Он должен был помочь русским интеллектуалам в переводе религиозных текстов и в общении с западноевропейскими коллегами, позволяя обсуждать достижения европейской мысли на родном языке.  

Пушкин соединил в себе два противоположных взгляда на русский язык

В начале XIX века в России возникли две принципиально разные группы мыслителей, известные как шишковисты и карамзинисты («архаисты» и «новаторы»), которые подвергли сомнению господствующую рационалистическую идеологию.

Архаисты во главе с военным и государственным деятелем Александром Шишковым стремились возродить язык и литературу Древней Руси, считая, что русский язык испорчен иностранным влиянием. Они хотели вернуться к церковнославянской письменной традиции и создать национальную литературу, отражающую национальное наследие.

В работах шишковистов часто встречались архаичные слова и формы, некоторые из них имели церковнославянское, а не восточнославянское происхождение.

Результатом их лексикографических усилий стал «Словарь Академии Российской» — первый академический словарь русского языка, шеститомный компендиум из почти 50 000 слов, опубликованный в самом конце XVIII века. Его целью была консервативная стандартизация языка путем создания четких толкований слов с примерами их употребления.

«Говорим по-русски!»: разговорные идиомы-неологизмы, слово «мир» и история «Словаря Академии Российской»О чем говорили Ольга Северская и ее гости в первом квартале 2024 годаКруг историка и писателя Николая Карамзина, напротив, стремился создать новый вариант языка, отвечающий эстетическим запросам светских образованных читателей и не в последнюю очередь — читательниц. Сам Карамзин оставил нам сентиментальные повести во французском стиле и романтизированную «Историю государства Российского». 

И архаисты, и карамзинисты внесли значительный вклад в развитие русского языка, его словарного состава, но первые были заняты его консервацией, и их фундаментальный словарь преследовал именно эти цели; вторым была чужда идея лексикографического мумифицирования живой языковой стихии.

Легкокрылый Пушкин имел отношение к обеим группам: он одним из первых был избран в члены Российской академии наук (но, по воспоминаниям, манкировал своим участием в составлении академического словаря) и при этом активно модернизировал русский язык в своей поэтической практике. Степень его языкового новаторства сравнима со злободневным остроумием Пелевина:

Но панталоны, фрак, жилет, 
Всех этих слов на русском нет;
А вижу я, винюсь пред вами,
Что уж и так мой бедный слог
Пестреть гораздо б меньше мог
Иноплеменными словами,
Хоть и заглядывал я встарь
В Академический словарь. 

Homo homini lupus est — гласит один крылатый
латинизм. Но человек человеку уже давно не волк.
Человек человеку даже не имиджмейкер, не дилер,
не киллер и не эксклюзивный дистрибьютор, как
предполагают современные социологи. Всё гораздо
страшнее и проще. Человек человеку вау —
и не человеку, а такому же точно вау. Так что
в проекции на современную систему культурных
координат это латинское изречение звучит так:
Вау Вау Вау! 

А. С. Пушкин. Евгений Онегин  В. О. Пелевин. Generation P

Спор архаистов и новаторов в словарном деле продолжился: в 1847 году выходит «Словарь церковнославянского и русского языка» Академии наук, в 1860-е — «Толковый словарь живого великорусского языка» Владимира Даля. Создание академического словаря финансировала казна, в то время как для Даля словарь стал делом всей жизни (читай, «хобби»), которое только после публикации принесло автору заслуженные почести. 

И само название словаря Даля (живой язык!), и его популярность вплоть до наших дней говорят о том, что его подход оказался более перспективным. Новаторский словарь стремился дать исчерпывающее объяснение значений практически всех русских слов, отразить богатое разнообразие диалектов. Он включал более двухсот тысяч статей с подробными описаниями, примерами употребления и этимологическими сведениями. Правда, Даль не смущался добавлять придуманные слова… 

Советские словарные проекты были подчинены идеологии, но иногда шли против течения

Видимо, в силу своей «народности» словарь Даля был минимально искажен советской цензурой, поэтому на протяжении десятилетий оставался символом «чистого», «старинного» языка и стоял на полке в каждой интеллигентной семье. Неудивительно, что Александр Солженицын при создании своего «Русского словаря языкового расширения» в значительной степени опирался на Даля. 

Тем временем новая советская лексикография развивала традиции дореволюционной Академии.  

«Толковый словарь русского языка» Ушакова в четырех томах — один из самых полных словарей советского времени: его отличает большой охват лексики, в нем есть многие архаичные и диалектные слова.

Изданный в 1935–1940 годах, словарь, конечно, отражает советскую практику — в толкованиях упор делается на идеологическое объяснение. Это видно, например, в статье «Символизм», где второе значение сформулировано так: «Направление в искусстве конца 19 и начала 20 вв., выражавшее упадочнические реакционные настроения буржуазии, в художественных образах создававшее символы мистических переживаний и представлений (лит., искус.)». 

«Посмотреть в Ушакове», или Как человек становится словаремЛекция доктора филологических наук Евгении Наумовны БасовскойСоциально-экономическим фоном для появления в СССР большого количества словарей стали массовая внутренняя миграция населения, урбанизация и технический прогресс. Эти факторы выдвинули на первый план людей с разным языковым опытом, зачастую не владевших специальной терминологией. При этом советская лексикографическая (равно как и педагогическая) практика основывалась на теории литературного языка, который понимался как «высшая форма существования языка». Эта теория предполагала создание директивных словарей, адресованных разным социальным группам — от школьников до носителей иностранного языка.

В то же время даже в условиях идеологических ограничений разрабатывались словари, построенные на новаторской теоретической базе.

Эти словари не были массовыми, но внесли значительный вклад в мировую лингвистику. Яркий пример такой работы — «Толково-комбинаторный словарь современного русского языка: опыты семантико-синтаксического описания русской лексики» (1984) под редакцией Игоря Мельчука и Александра Жолковского. Значение этого словаря намного превосходит его скромный объем (всего 282 статьи).

Во-первых, в его основе лежит теоретическая модель «Смысл — текст», предполагающая целостное описание слов, в том числе морфологическую, семантическую, стилистическую и идиоматическую информацию, а также энциклопедические сведения, необходимые для правильного употребления каждого слова. 

Во-вторых, в нем используется понятие лексической функции, которое позволяет описать глубокие семантические отношения между лексемами. Например, лексическая функция Magn ‘в очень высокой степени’ для разных существительных имеет разные реализации-прилагательные:  Magn (болезнь) = тяжелая, Magn (дождь) = проливной, Magn (радость) = огромная.

Еще один выдающийся труд — «Грамматический словарь русского языка», составленный Андреем Зализняком и опубликованный в 1974 году. Его тоже трудно назвать массовым. Слова в нем расположены в обратном алфавитном порядке, и для каждого слова указаны тип склонения и ударения, что позволяет автоматически генерировать все формы слова. Словарь Зализняка был весьма впечатляющим достижением отечественной лексикографии, учитывая сложность русской морфологии и отсутствие персональных компьютеров в то время.

Сегодня русская лексикография включает прескриптивное (предписывающее) и дескриптивное (описывающее) направления, которые реализуют разные подходы к словарному представлению лексики.

Первый подход поддерживается заинтересованностью государства в контроле над языком, которая затрагивает и словари. Так, принятый в 2005 году Закон о государственном языке установил, что языковые нормы фиксируются, помимо прочих источников, в нормативных словарях. Удивительно, что новаторский на момент появления «Грамматический словарь» выглядит в списке нормативных словарей таким же устаревшим, как и словарь Даля на полке советского интеллигента.

Второе направление сочетает фундаментальные достижения советской эпохи с передовыми информационными технологиями, основанными на больших коллекциях реальных языковых данных. В рамках этого подхода создается большинство академических словарей. «Активный словарь русского языка» под редакцией Юрия Апресяна даже в своем названии перекликается с «живым языком» Даля.

Цифровые технологии стремительно меняют будущее лексикографии

В последние десятилетия использование традиционных бумажных словарей сокращается: они занимают много места на полке и неудобны для поиска. В то же время электронные словари процветают; преимущества электронного формата сделали их основным источником словарной информации. В этом направлении развивается Метасловарь Грамоты, который объединяет различные лексикографические ресурсы в единую, удобную и интерактивно связанную систему. А с 2024 года Грамота начала включать в Метасловарь новейшую лексику, которая не представлена ни в одном словаре. 

Еще одно новшество — современные языковые модели, которые обучаются на огромных массивах текстов и анализируют закономерности употребления слов. Большие языковые модели открывают новые перспективы для автоматизированного обновления словарей, создания более точных описаний значений слов и учета их актуального употребления в различных контекстах. И хотя критики считают, что модели вроде ChatGPT на самом деле не понимают язык и лишь комбинируют известные шаблоны, их способность обращаться к гигантским объемам данных в реальном времени делает их все более заметным игроком и на поле реального языкового опыта, и на поле его лексикографической фиксации.

Как искусственный интеллект изменит возможности ГрамотыУмный поиск, обновленная Справка и текстовый робот-ассистентС одной стороны, новые технологии предоставляют равный доступ к языку и тем, кто не владеет им на достаточном уровне, например мигрантам или носителям унаследованного языка. С другой — с развитием технологий значительно увеличивается количество текстов, которые будут менять языковую реальность. С точки зрения языковой политики это свидетельствует об уменьшении роли институтов в процессе кодификации языка.

Языковые модели следуют статистическим закономерностям языка, а не предписанным нормам, будь они сверхконсервативными или в высшей степени инновационными.

Развитие технологий принципиально меняет восприятие языковых норм: они становятся более гибкими, вероятностными, зависимыми от узуса, что позволяет говорить о постепенном ослаблении прескриптивных установок в лексикографии. Этот процесс связан с развитием корпусной лингвистики — прежде всего Национального корпуса русского языка, который способствовал переходу от нормативного подхода к анализу и описанию языковых данных.

Изменения затронули и Грамоту. Портал всегда был ориентирован на предоставление сведений об устоявшихся, проверенных языковых нормах журналистам, редакторам, преподавателям, а затем и широкой аудитории. Однако начиная с 2024 года некоторые его материалы, включая словарные определения новых слов и словоизменительные парадигмы, частично генерируются ИИ с последующей проверкой специалистами.

История лексикографии — это история борьбы между предписанием и описанием, между нормативностью и вариативностью, прошлым и будущим.

Академические словари и в XIX, и в XX веке были направлены на фиксацию строгих норм, отражающих государственные представления о правильном языке. При этом история лексикографии знает и альтернативные подходы, описывающие язык в его реальном употреблении.

Заглядывая в будущее лексикографии, я представляю себе многомерные базы данных. Они будут не только предлагать полное семантическое описание каждого слова, но и включать информацию о конструкциях, фразеологии, семантических тонкостях, показывать статистику использования слова в режиме реального времени. По сути эта будущая система выйдет за рамки толкования слов и превратится в интерактивный информационный портал, прототип которого мы уже видим на сайте НКРЯ в виджете «Портрет слова». Этот формат будет кардинально отличаться от традиционных бумажных изданий. Но будет ли эта информационная система по-прежнему называться словарем?

Статья подготовлена по материалам интервью, которое автор дал Илану Стэвансу для издания «Беседы о словарях: Вселенная в книге» (Stavans I. Conversations on Dictionaries: The Universe in a Book. Cambridge University Press, 2025).

· руководитель ИИ-направления Грамоты, кандидат филологических наук, PhD

Еще на эту тему

Как история языка разрешила спор Шишкова и Карамзина? Рассказывает филолог Юрий Кагарлицкий

Слово «трогательный» осталось в русском языке вопреки логике

К двухсотлетию со дня рождения Владимира Ивановича Даля

«Язык народа, бесспорно, главнейший и неисчерпаемый родник или рудник наш...»

Авторская лексикография в отечественном языкознании

Словари языка писателей и других авторов можно классифицировать на основе десяти признаков

все публикации

«Розенталь хотел, чтобы мы гибко подходили к языку»

Заведующий кафедрой стилистики русского языка факультета журналистики МГУ Владимир Славкин — о том, что отличало Дитмара Розенталя как автора, педагога и консультанта

Лингвист Борис Иомдин рассказал в подкасте «Покажи язык» про язык как средство разобщения

Коммуникативные неудачи могут возникать из-за различий в возрасте и опыте

Михаил Острогорский требует от технических текстов понятности, однозначности и четкой структуры

Технический писатель — о коммуникативной задаче и языковых особенностях хорошей документации

Лингвист Александр Летучий написал книгу о сложностях русского синтаксиса

Автор показывает на примерах, как синтаксис связан с интонацией и со значением слов

Галифе, макинтош и лошадь Пржевальского: какие бывают эпонимы

Мария Елифёрова рассказывает об именах, которые прошли путь из собственных в нарицательные

Как сохранить нивхский и другие малые языки? Интервью лингвиста Павла Гращенкова

Языки ценны не только как культурное наследие, но и как источник данных для науки

Тест: что значило это слово во времена Екатерины II?

Проверьте, насколько хорошо вы понимаете русский язык XVIII века

Как появилось табу на имена животных, растений, духов и колдунов

Вышло переиздание классического труда этнографа Дмитрия Зеленина

«Ужастно симпотичный»: что такое гиперкоррекция и к каким ошибкам она приводит

За каждой ошибкой от старательности лежит правило, которое применили не к месту

Как учат иноязычных детей в разных странах мира

Каждый ребенок имеет право на образование — даже если он пока не знает языка, на котором говорят в школе

День борьбы с ненормативной лексикой: можно ли обойтись без мата?

Обсценная лексика есть во всех языках, но в русском она сильнее табуирована

Тест: выберите правильный пароним!

Похожие слова часто становятся источником путаницы и ошибок

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!