Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Как пришествие корпусов меняет лингвистику

Как пришествие корпусов меняет лингвистику
Источник: Wikimedia Commons

За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».

Первые корпусы появились в 1960-х годах, но тогда не нашли широкого применения, отмечает Владимир Плунгян. У них был небольшой объем и очень ограниченные возможности для формулировки запросов. Сегодня в корпус входит несколько миллиардов словоупотреблений, а его функции исключительно разнообразны. Например, в нем можно найти найти все художественные тексты Тургенева за определенный период, в которых есть расположенные рядом слово роза и прилагательное, обозначающее цвет.

Сегодня есть множество корпусов текстов на русском языке, но главное отличие именно Национального корпуса в том, что он создан учеными и программистами не только для себя, но и для обычных пользователей, подчеркивает академик. Он дает возможность получить сведения, извлечь которые в докорпусную эпоху было немыслимо. 

Например, можно ли сказать медленно прыгнул или умею во что-то? Во втором случае корпус подсказывает, что такая формула уже вошла в язык, перестав быть просто молодежным сленгом (Кто-нибудь умеет в мобильные сайты?). По словам Владимира Плунгяна, «во множестве задокументированные примеры позволяют утверждать, что эти семантические изменения произошли».

В России сейчас существует около восьмидесяти корпусов для отдельных языков нашей страны, рассказал директор Института языкознания РАН Андрей Кибрик. Среди них есть корпусы по большим языкам (часто имеющим статус титульных в республиках — бурятскому, калмыцкому, чувашскому, татарскому, якутскому и другим), а есть корпусы по малым, бесписьменным языкам. 

Кроме того, есть особые диалектные корпусы, которые отражают местные разновидности, а также корпусы устной речи, жестовых языков для глухих и слабослышащих. Даже если язык относится к числу вымирающих, корпус по нему очень нужен, ведь это — слепок уходящей культуры, которая должна остаться в истории языков страны и планеты, отметил Андрей Кибрик.

На заседании также выступили доктор филологических наук Екатерина Рахилина (НИУ ВШЭ), член-корреспондент РАН Ирма Муллонен (Институт языка, литературы и истории КарНЦ РАН), академик Александр Молдован (ИРЯ РАН),  Кирилл Медведев («Яндекс»).

Портал «Грамота.ру»

Еще на эту тему

Национальному корпусу русского языка исполняется 20 лет

Поздравляем наших партнеров и рассказываем об их успехах

Как цифровизация помогает сохранить языки коренных народов России

Голосовые помощники, цифровые учебники и онлайн-переводчики вносят вклад в создание языковой среды

Владимир Плунгян: «Первый урок корпуса — не злоупотреблять нормализаторством»

Корпус учит лингвистов не доверять своей интуиции и изучать те явления, которые встречаются часто

все публикации

Чтобы хорошо учиться, детям нужно больше слов

Исследователи рекомендуют увеличивать словарный запас детей тремя способами


Чтение: практика, меняющая сознание

Пять книг о том, зачем мы читаем и как получить от этого занятия пользу и удовольствие


Вышел первый выпуск журнала «Русская речь» за 2024 год

«Фреш», «бишь» и научная терминология до Ломоносова 


Зоолог Арик Кершенбаум: «Мы все хотим знать, что говорят животные»

Интервью с автором новой книги о коммуникации в дикой природе


Чем нас привлекают искусственные языки

Их создание и изучение помогает лучше понять границы естественного языка


Вышла в свет книга археолога Стивена Митена «Загадка языка»

В ней утверждается, что язык возник примерно 1,6 млн лет назад


Право на имя

Когда выбор способа называть человека или группу людей становится проблемой


Между эмбрионом и покойником: где расположены роботы на шкале одушевленности

Каждый месяц мы выбираем и комментируем три вопроса, на которые ответила наша справочная служба


Эвфемизмы: от суеверий до политкорректности

«Благозвучные» слова используют не только вместо ругательств



Критический взгляд на текст: как увидеть искажения и ловушки

Чтобы лучше понимать прочитанное, нужно развивать читательскую грамотность


Новые возможности восприятия книг: что лучше, буквы или звуки?

Слуховое чтение набирает популярность, но для него все равно нужны письменные тексты


«Давать» и «дарить»: какие слова можно считать однокоренными

Лингвист Борис Иомдин описывает два критерия, которыми могут пользоваться школьники


Как лингвисты проводят эксперименты: от интроспекции до Amazon

Какие инструменты они используют и где ищут участников, рассказывает «Системный Блокъ»


«Я хочу продолжать работать с текстами»

История незрячего редактора Иоланты, которая благодаря цифровым технологиям может заниматься тем, что нравится


Наследие Михаила Панова и судьбы русской орфографии

Статья Владимира Пахомова в журнале «Неофилология» помогает осмыслить проблемы русского правописания


Праздники грамотности

Как в мире проверяют знание правил родного языка


Научный стиль: точность не в ущерб понятности

Им пользуются авторы учебников, исследователи, лекторы, научные журналисты


Самый важный предмет. Функциональный подход к обучению русскому языку

Лекция Марии Лебедевой для Тотального диктанта о роли языка в учебе и в жизни


Карточки Марины Королёвой вышли в виде книги «Русский в порядке»

Получился маленький словарь трудностей русского языка