Подсказки для поиска

Как пришествие корпусов меняет лингвистику

Как пришествие корпусов меняет лингвистику
Источник: Wikimedia Commons

За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».

Первые корпусы появились в 1960-х годах, но тогда не нашли широкого применения, отмечает Владимир Плунгян. У них был небольшой объем и очень ограниченные возможности для формулировки запросов. Сегодня в корпус входит несколько миллиардов словоупотреблений, а его функции исключительно разнообразны. Например, в нем можно найти найти все художественные тексты Тургенева за определенный период, в которых есть расположенные рядом слово роза и прилагательное, обозначающее цвет.

Сегодня есть множество корпусов текстов на русском языке, но главное отличие именно Национального корпуса в том, что он создан учеными и программистами не только для себя, но и для обычных пользователей, подчеркивает академик. Он дает возможность получить сведения, извлечь которые в докорпусную эпоху было немыслимо. 

Например, можно ли сказать медленно прыгнул или умею во что-то? Во втором случае корпус подсказывает, что такая формула уже вошла в язык, перестав быть просто молодежным сленгом (Кто-нибудь умеет в мобильные сайты?). По словам Владимира Плунгяна, «во множестве задокументированные примеры позволяют утверждать, что эти семантические изменения произошли».

В России сейчас существует около восьмидесяти корпусов для отдельных языков нашей страны, рассказал директор Института языкознания РАН Андрей Кибрик. Среди них есть корпусы по большим языкам (часто имеющим статус титульных в республиках — бурятскому, калмыцкому, чувашскому, татарскому, якутскому и другим), а есть корпусы по малым, бесписьменным языкам. 

Кроме того, есть особые диалектные корпусы, которые отражают местные разновидности, а также корпусы устной речи, жестовых языков для глухих и слабослышащих. Даже если язык относится к числу вымирающих, корпус по нему очень нужен, ведь это — слепок уходящей культуры, которая должна остаться в истории языков страны и планеты, отметил Андрей Кибрик.

На заседании также выступили доктор филологических наук Екатерина Рахилина (НИУ ВШЭ), член-корреспондент РАН Ирма Муллонен (Институт языка, литературы и истории КарНЦ РАН), академик Александр Молдован (ИРЯ РАН), Кирилл Медведев («Яндекс»).

Портал «Грамота.ру»

Еще на эту тему

Национальному корпусу русского языка исполняется 20 лет

Поздравляем наших партнеров и рассказываем об их успехах

Как цифровизация помогает сохранить языки коренных народов России

Голосовые помощники, цифровые учебники и онлайн-переводчики вносят вклад в создание языковой среды

Владимир Плунгян: «Первый урок корпуса — не злоупотреблять нормализаторством»

Корпус учит лингвистов не доверять своей интуиции и изучать те явления, которые встречаются часто

все публикации

В среднем человек ругается 250 тысяч раз за жизнь — как к этому относиться?

Константин Деревянко, Ярослав Скворцов и Владимир Легойда обсудили ненормативную лексику

Тест: знаете ли вы значение этих устаревших слов?

Увраж, палаш, ажитация и еще семь слов, которые мы больше не используем

Я вижу, значит, я понимаю: как устроены метафоры восприятия

Лингвист Валерий Шульгинов о мыслях в животе, текучем времени и связи слуха с послушанием

Страсти вокруг нормы

Светлана Друговейко-Должанская о том, почему кодификация языковых явлений не может строиться на личных предпочтениях

Лингвист Алексей Шмелев: «У слова „столько“ есть полная парадигма единственного числа»

«Правмир» поговорил о русском языке и лингвистике с председателем Орфографической комиссии РАН

Практическое руководство по использованию эмодзи: как избежать конфуза

Результаты нашего опроса и маленький словарик в помощь сомневающимся

Как образуются новые слова: старые модели, новые потребности

Полуногав для турникмэна и улучшайзинг человейника

«Дорогие дети! Я в вас верю, всё будет в порядке!»

Психолог Елена Морозова о том, как пережить ЕГЭ

Что такое бывшие диминутивы и как они возникают

Зяблик, ласточка, букашка потеряли связь со своими «родителями» и стали самостоятельными словами

Николай Карамзин, сентименталист-революционер

Рассказываем о ключевых исторических фигурах, повлиявших на развитие русского письменного языка

Что в эмодзи тебе моем: как смайлы помогают и мешают нам общаться

Улыбка в рабочей переписке может оскорбить, а пицца в описании профиля — напугать

Термины родства и свойства́ в русском языке

В День семьи разбираемся, чьим мужем может быть зять и от кого нужно скрываться невестке

Евгений Головко о связи лингвистики с науками о человеке и обществе

Для антропологической лингвистики язык — прежде всего культурный маркер

Тест на общие корни: найдите дальних родственников!

Чтобы увидеть этимологические связи между русскими словами, приходится вспоминать латынь и греческий

Яков Грот, систематизатор русской орфографии

Рассказываем о ключевых исторических фигурах, повлиявших на развитие русского письменного языка

Какие фамилии в русском языке не склоняются?

На склонение фамилии влияет не только пол ее носителя

Почему так трудно выбрать номинацию для людей с инвалидностью?

Ни прямота, ни политкорректность сами по себе не решают проблемы

1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!