Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Как пришествие корпусов меняет лингвистику

Как пришествие корпусов меняет лингвистику
Источник: Wikimedia Commons

За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».

Первые корпусы появились в 1960-х годах, но тогда не нашли широкого применения, отмечает Владимир Плунгян. У них был небольшой объем и очень ограниченные возможности для формулировки запросов. Сегодня в корпус входит несколько миллиардов словоупотреблений, а его функции исключительно разнообразны. Например, в нем можно найти найти все художественные тексты Тургенева за определенный период, в которых есть расположенные рядом слово роза и прилагательное, обозначающее цвет.

Сегодня есть множество корпусов текстов на русском языке, но главное отличие именно Национального корпуса в том, что он создан учеными и программистами не только для себя, но и для обычных пользователей, подчеркивает академик. Он дает возможность получить сведения, извлечь которые в докорпусную эпоху было немыслимо. 

Например, можно ли сказать медленно прыгнул или умею во что-то? Во втором случае корпус подсказывает, что такая формула уже вошла в язык, перестав быть просто молодежным сленгом (Кто-нибудь умеет в мобильные сайты?). По словам Владимира Плунгяна, «во множестве задокументированные примеры позволяют утверждать, что эти семантические изменения произошли».

В России сейчас существует около восьмидесяти корпусов для отдельных языков нашей страны, рассказал директор Института языкознания РАН Андрей Кибрик. Среди них есть корпусы по большим языкам (часто имеющим статус титульных в республиках — бурятскому, калмыцкому, чувашскому, татарскому, якутскому и другим), а есть корпусы по малым, бесписьменным языкам. 

Кроме того, есть особые диалектные корпусы, которые отражают местные разновидности, а также корпусы устной речи, жестовых языков для глухих и слабослышащих. Даже если язык относится к числу вымирающих, корпус по нему очень нужен, ведь это — слепок уходящей культуры, которая должна остаться в истории языков страны и планеты, отметил Андрей Кибрик.

На заседании также выступили доктор филологических наук Екатерина Рахилина (НИУ ВШЭ), член-корреспондент РАН Ирма Муллонен (Институт языка, литературы и истории КарНЦ РАН), академик Александр Молдован (ИРЯ РАН), Кирилл Медведев («Яндекс»).

Портал «Грамота.ру»

Еще на эту тему

Национальному корпусу русского языка исполняется 20 лет

Поздравляем наших партнеров и рассказываем об их успехах

Как цифровизация помогает сохранить языки коренных народов России

Голосовые помощники, цифровые учебники и онлайн-переводчики вносят вклад в создание языковой среды

Владимир Плунгян: «Первый урок корпуса — не злоупотреблять нормализаторством»

Корпус учит лингвистов не доверять своей интуиции и изучать те явления, которые встречаются часто

все публикации


Коллекция «ПостНауки»: сколько в мире языков и какие самые сложные

Мнение лингвистов о языковом разнообразии, двух типах исследователей и пользе мертвых языков


Слово года по версии Грамоты. Как мы его выбираем?

От составления длинного списка до экспертного голосования


Как вы пользуетесь Грамотой? Пять рассказов от первого лица

Порталу исполняется 24 года! Отмечаем день рождения вместе с вами


Лингвист Олег Беляев об истории осетинского языка и его особенностях

«Один раз выучил окончание и везде его ставишь — это называется агглютинация»


Тест: в каком предложении нет ни одной ошибки?

Вам предстоит критически оценить сорок предложений из художественной литературы и найти десять безупречных


Категория рода в русской грамматике в сравнении с другими языками

«Лосось», «лебедь», «дитя», «невежда» и другие языковые сущности сложной судьбы


Пол Грэм: «Мир, разделенный на пишущих и не пишущих, опаснее, чем кажется»

Программист и предприниматель Пол Грэм описал будущее, в котором ИИ пишет тексты за человека


Слова-путешественники: каким образом русские слова оказались вдали от России

И насколько эти заимствования были изначально русскими? Разбирается лингвист Мария Елифёрова


Метапредметный подход в обучении русскому языку: один за всех, все за одного

Без знания лексики и умения извлекать смысл из текста страдают математика и другие школьные предметы


Словарный запас: как его оценить и на что он влияет

Хорошая новость состоит в том, что взрослые продолжают его расширять до 55 лет и даже дольше


Елена Березович: «Диалектологам становится все труднее работать»

Профессор Уральского университета обобщила результаты анкетирования коллег 


Учитель Сергей Волков: «А давайте сказку про репку перескажем гекзаметром!»

Как учить детей русскому языку в эпоху торжества технологий и сглаживания иерархии культур



О чем мы можем узнать из средневековых рукописных текстов

Интервью с медиевистом Олегом Воскобойниковым на канале «Основа»


Как лучше описывать разговорную лексику в словарях

Лингвисты обсуждают проблемы лексикографического представления диалектизмов, регионализмов, феминитивов и «жестовых» слов


Как лингвистическая экспертиза может повысить качество учебников

Главные критерии — понятность, интересность и тематический баланс


Общение в интернете происходит на особом устно-письменном языке

Его отличия от разговорного языка и от обычного письменного анализируются в статье Натальи Клушиной


Что такое старомосковское произношение

Говор стал престижным в тот момент, когда начал устаревать



1/6
Большой универсальный словарь русского языка (2 тома)
1 — 4 классы
Морковкин В.В., Богачева Г.Ф., Луцкая Н.М.
4.3
Подробнее об издании
От 2320 ₽
Купить на маркетплейсах:
Назовите ваше слово года!
Какие новые слова в 2024 году прочно вошли в вашу речь? На какие вы обратили внимание, какие стали чаще слышать вокруг? Участвуйте в выборе «Слова года» по версии Грамоты.
Отправить
Спасибо!
Мы получили ваш ответ и обязательно учтем его при составлении списка слов-кандидатов
Читать Грамоту дальше
Новые публикации Грамоты в вашей почте
Неверный формат email
Подписаться
Спасибо,
подписка оформлена.
Будем держать вас в курсе!