Подсказки для поиска

Как пришествие корпусов меняет лингвистику

Как пришествие корпусов меняет лингвистику
Источник: Wikimedia Commons

За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».

Первые корпусы появились в 1960-х годах, но тогда не нашли широкого применения, отмечает Владимир Плунгян. У них был небольшой объем и очень ограниченные возможности для формулировки запросов. Сегодня в корпус входит несколько миллиардов словоупотреблений, а его функции исключительно разнообразны. Например, в нем можно найти найти все художественные тексты Тургенева за определенный период, в которых есть расположенные рядом слово роза и прилагательное, обозначающее цвет.

Сегодня есть множество корпусов текстов на русском языке, но главное отличие именно Национального корпуса в том, что он создан учеными и программистами не только для себя, но и для обычных пользователей, подчеркивает академик. Он дает возможность получить сведения, извлечь которые в докорпусную эпоху было немыслимо. 

Например, можно ли сказать медленно прыгнул или умею во что-то? Во втором случае корпус подсказывает, что такая формула уже вошла в язык, перестав быть просто молодежным сленгом (Кто-нибудь умеет в мобильные сайты?). По словам Владимира Плунгяна, «во множестве задокументированные примеры позволяют утверждать, что эти семантические изменения произошли».

В России сейчас существует около восьмидесяти корпусов для отдельных языков нашей страны, рассказал директор Института языкознания РАН Андрей Кибрик. Среди них есть корпусы по большим языкам (часто имеющим статус титульных в республиках — бурятскому, калмыцкому, чувашскому, татарскому, якутскому и другим), а есть корпусы по малым, бесписьменным языкам. 

Кроме того, есть особые диалектные корпусы, которые отражают местные разновидности, а также корпусы устной речи, жестовых языков для глухих и слабослышащих. Даже если язык относится к числу вымирающих, корпус по нему очень нужен, ведь это — слепок уходящей культуры, которая должна остаться в истории языков страны и планеты, отметил Андрей Кибрик.

На заседании также выступили доктор филологических наук Екатерина Рахилина (НИУ ВШЭ), член-корреспондент РАН Ирма Муллонен (Институт языка, литературы и истории КарНЦ РАН), академик Александр Молдован (ИРЯ РАН), Кирилл Медведев («Яндекс»).

Портал «Грамота.ру»

Еще на эту тему

Национальному корпусу русского языка исполняется 20 лет

Поздравляем наших партнеров и рассказываем об их успехах

Как цифровизация помогает сохранить языки коренных народов России

Голосовые помощники, цифровые учебники и онлайн-переводчики вносят вклад в создание языковой среды

Владимир Плунгян: «Первый урок корпуса — не злоупотреблять нормализаторством»

Корпус учит лингвистов не доверять своей интуиции и изучать те явления, которые встречаются часто

все публикации

Владимир Гиляровский, «король репортеров»

К 170-летию со дня рождения писателя и журналиста Музей Москвы показывает документы из найденного недавно архива 

Он или она? Как языки обходятся без указания на пол

Есть разные способы избежать уточнения или, наоборот, внести ясность

Могут ли нейросети написать «Войну и мир» и куда они заведут человечество

На форуме «Территория будущего. Москва 2030» рассказали о возможностях ИИ

Слова на карте: как лексика объединяет и разделяет страны

Лингвистические карты показывают родство языков и языковые контакты

Сергей Ожегов, борец за самобытность родного языка

К 125-летию со дня рождения лексикографа рассказываем о десяти фактах его биографии

Калеб Эверетт написал книгу о языковом многообразии

Научный редактор книги Валерий Шульгинов представляет ее читателям Грамоты

Как эвфемизмы в рекламе влияют на наше поведение

«Спецпредложение» звучит более заманчиво, чем «скидка»

А и Б сидели на трубе: семь детских книг о буквах и знаках

Иногда А, Я и даже точка могут стать главными героями поучительных историй

Опять запятые! Сложный пунктуационный тест

Десять цитат из русской классики, которые нужно написать без ошибок

Михаил Штудинер не спешит изгонять из языка то, что в нем еще живо

Автор «Словаря трудностей русского языка» — об объективном характере нормы и ее субъективной фиксации

Как менялись библиотеки?

История книжных коллекций от собраний табличек до храмов литературы в новой книге МИФа

Новое образование для «нового человека»: как учили грамоте в советской школе сто лет назад

31 августа исполняется сто лет декрету о всеобщем начальном обучении в РСФСР

Язык и пространство: что находится в центре мира?

Реки, горы и стороны света могут быть встроены в языковую систему координат, объясняет Валерий Шульгинов

Курсы лекций Ирины Кобозевой и Андрея Кибрика доступны на платформе Teach-in

Не нужно быть студентом, чтобы погрузиться в лексическую семантику и ареальную лингвистику

Как философы пытались создать идеальные языки

Продуманные, точные — но абсолютно непригодные для общения

Чем речовка лучше речевки? Три переменчивых неологизма XX века 

Раньше слова «речовка», «плащовка» и «мелочовка» писались по-другому

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2025 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!