Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...В.: У корпуса есть продуктовый комитет, который решает...
...Материалы для основного корпуса были подобраны так,...
...Все корпуса снабжены морфологической разметкой, то...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...морфологической разметки всех текстов обучающего корпуса...
... Особенность корпуса в том, что можно задать...
...Подробнее о новостях Национального корпуса русского...
Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...
...английского языка, основанную на анализе большого корпуса...
...проанализировала пять наборов данных на английском языке: два корпуса...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Добавились два новых корпуса: «Русская классика...
...Подробнее о новостях Национального корпуса русского...
В новом номере журнала (Серия 9. Филология) опубликовано продолжение лексикографических этюдов о языке Пушкина доктора филологических наук, профессора кафедры русского языка филологического факультета МГУ им. М. В. Ломоносова Ольги Кукушкиной. Эта серия работ опирается на анализ корпуса пушкинских текстов, созданного в Лаборатории общей и компьютерной лексикологии и лексикографии филологического факультета.
...В новом номере журнала (Серия 9. Филология) опубликовано...
...контр-адмирал и о создании синтаксического корпуса...
Всё чаще можно слышать, что большие языковые модели вроде ChatGPT «пишут как люди». На первый взгляд их способность имитировать нашу речь действительно потрясает. Но более пристальный научный анализ все же выявляет различия. Научная группа из Университета Карнеги — Меллона (США) проверила с помощью методов корпусного анализа, насколько созданные человеком тексты отличаются от текстов в тех же жанрах и стилях, но созданных языковыми моделями (LLM).
...Для дальнейшего анализа были сформированы два корпуса...
...выборке текстов, согласуются с данными большого корпуса...
Ведущий подкаста «Сложное предложение» лингвист Игорь Исаев пригласил авторов книги «Запретные слова», докторов филологических наук Анатолия Баранова и Дмитрия Добровольского поговорить о русском мате: его изучении, его уместности и его табуированности. Грамота изложила близко к тексту фрагменты этого разговора.
...Ведущий подкаста «Сложное предложение»...
....: Мы ее смотрели по корпусам, но корпуса не отражают...
...Д.: Материал сейчас собирают с помощью корпуса....
... Любой хороший словарь делается на основе корпуса...
За два века слово может изменить свое значение до неузнаваемости. Многие слова, которыми мы пользуемся сегодня, совершенно иначе воспринимались нашими предками, пишет «Системный Блокъ». Тест на лингвистическую интуицию: сможете ли вы догадаться, когда возникла поговорка «голод не тетка», а слово «молодец» стало похвалой?
...За два века слово может изменить свое значение до неузнаваемости...
...было бы возможным без НКРЯ — Национального корпуса...
Сможете ли вы угадать, кто такой халадур (или что это)? А найти аналог французского выражения «он стреляет из четырех ружей» в русском языке? Такие задания можно найти в книге «Тридцать шесть подсвечников», написанной веселыми российскими лингвистами. Мы выбрали пять языковых игр и предлагаем вам сыграть в одну из них прямо сейчас. Если вам станет интересно — в книге их гораздо больше!
...Сможете ли вы угадать, кто такой халадур (или что это...
...Судя по данным Национального корпуса русского языка...
...можно составить заранее, зайдя на сайт Национального корпуса...
«Мой авто» или «мое авто»? «Весной» или «весною»? О вариантах нормы и их функции в языковой системе рассказывает статья журнала «Наука и жизнь».
...«Мой авто» или «мое авто»?...
...Как следует из данных Национального корпуса русского...