водолей лечит | Журнал | Поиск по Грамоте

Кому и зачем нужен Национальный корпус русского языка

Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.

...Девятнадцать лет назад в России появился электронный...

...Грамота: С какими целями создавался корпус? А. К.:...

В чем язык животных похож на человеческий

Исследователи из разных областей науки — лингвисты, зоопсихологи, биологи — много лет пытаются расшифровать системы коммуникации других видов. И заодно понять, что же представляет собой речь, если ей владеем не только мы. Грамота попыталась разобраться, к каким выводам они пришли на сегодняшний день.

...Исследователи из разных областей науки —...

...Человеческий язык — что в нем такого...

Слова на карте: как лексика объединяет и разделяет страны

Территориальное распространение языков, диалектов и отдельных языковых явлений изучает ареальная лингвистика. Есть и более узкая дисциплина — лингвистическая география, которая занимается составлением языковых карт. Что интересного могут показать нам такие карты? Например, можно увидеть, как универсальные слова, обозначающие всем известные сущности, умеют членить мир на части.

...Территориальное распространение языков, диалектов и...

...Откуда берутся «всемирные» слова Слова...

Маргиналы цифрового мира: можно ли улучшить распознавание редких языков

Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...

...Современные инструменты распознавания языков, такие...

Хлестаков и курьеры

Заметки филолога Бориса Шварцкопфа о знаменитой цитате из «Ревизора», опубликованные в «Русской речи» (1968, № 6).

...Заметки филолога Бориса Шварцкопфа о знаменитой цитате...

...Как известно, Хлестаков, расхваставшись перед чиновниками...

Нейросети научились обману и манипуляциям вопреки запретам

Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...

...Генеративные нейросети обучаются на огромных объемах...

Минимум 13% аннотаций к научным статьям создается с помощью нейросетей

Генеративные нейросетевые модели уже используются в научных текстах, и это не новость. Но насколько активно ученые прибегают к таким инструментам — хотя бы на уровне создания аннотаций к своим статьям? Группа ученых из Германии и США проанализировала более 15 млн англоязычных аннотаций биомедицинских статей из базы PubMed с 2010 по 2024 год. Их интересовали статистически измеримые перемены в

...Генеративные нейросетевые модели уже используются в...

Ольга Крючкова: «Работа по сбору и сохранению диалектной речи — это историческая миссия лингвистов»

Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.

...Наша кафедра теории, истории языка и прикладной лингвистики...

...Диалектный корпус позволяет ставить и решать новые...

Попадает в самое сердечко... Почему теперь так говорят?

Загадочное явление современного русского языка — всё чаще мелькает и распространяется в речи диминутив сердечко, причем в таком контексте, где он кажется удивительно архаичным: в контексте эмоциональных переживаний, в том числе в первом лице и в речи мужчин. Лингвист Ирина Фуфаева попыталась разгадать эту загадку.

...Загадочное явление современного русского языка &mdash...

...Это же слово из XIX века, не так ли? Даже из эпохи...

Право на имя

Приятель брата — Митя или Дима? А новая коллега — Женя или Евгения? Анна Ивановна считает себя начальником или начальницей? Как описать соседа: он глухой или с нарушениями слуха? Во многих ситуациях нам приходится делать этот непростой выбор. На что лучше ориентироваться: на мнение того, о ком речь, на правила языка или на собственное удобство? Грамота расспросила об этом популяризатора лингвистики, кандидата филологических наук Александра Пиперски.

...Приятель брата — Митя или Дима? А новая...

...Выбор имени: родители, святцы и другие алгоритмы...

Почитать на грамоте