Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Исследователи из разных областей науки — лингвисты, зоопсихологи, биологи — много лет пытаются расшифровать системы коммуникации других видов. И заодно понять, что же представляет собой речь, если ей владеем не только мы. Грамота попыталась разобраться, к каким выводам они пришли на сегодняшний день.
...Исследователи из разных областей науки —...
...Человеческий язык — что в нем такого...
Территориальное распространение языков, диалектов и отдельных языковых явлений изучает ареальная лингвистика. Есть и более узкая дисциплина — лингвистическая география, которая занимается составлением языковых карт. Что интересного могут показать нам такие карты? Например, можно увидеть, как универсальные слова, обозначающие всем известные сущности, умеют членить мир на части.
...Территориальное распространение языков, диалектов и...
...Откуда берутся «всемирные» слова Слова...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Заметки филолога Бориса Шварцкопфа о знаменитой цитате из «Ревизора», опубликованные в «Русской речи» (1968, № 6).
...Заметки филолога Бориса Шварцкопфа о знаменитой цитате...
...Как известно, Хлестаков, расхваставшись перед чиновниками...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Генеративные нейросетевые модели уже используются в научных текстах, и это не новость. Но насколько активно ученые прибегают к таким инструментам — хотя бы на уровне создания аннотаций к своим статьям? Группа ученых из Германии и США проанализировала более 15 млн англоязычных аннотаций биомедицинских статей из базы PubMed с 2010 по 2024 год. Их интересовали статистически измеримые перемены в
...Генеративные нейросетевые модели уже используются в...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Диалектный корпус позволяет ставить и решать новые...
Загадочное явление современного русского языка — всё чаще мелькает и распространяется в речи диминутив сердечко, причем в таком контексте, где он кажется удивительно архаичным: в контексте эмоциональных переживаний, в том числе в первом лице и в речи мужчин. Лингвист Ирина Фуфаева попыталась разгадать эту загадку.
...Загадочное явление современного русского языка &mdash...
...Это же слово из XIX века, не так ли? Даже из эпохи...
Приятель брата — Митя или Дима? А новая коллега — Женя или Евгения? Анна Ивановна считает себя начальником или начальницей? Как описать соседа: он глухой или с нарушениями слуха? Во многих ситуациях нам приходится делать этот непростой выбор. На что лучше ориентироваться: на мнение того, о ком речь, на правила языка или на собственное удобство? Грамота расспросила об этом популяризатора лингвистики, кандидата филологических наук Александра Пиперски.
...Приятель брата — Митя или Дима? А новая...
...Выбор имени: родители, святцы и другие алгоритмы...