Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Проект «Слово Толстого» — цифровой...
Участники Тотального диктанта — люди, у которых есть мотивация писать грамотно. В чем тогда причина регулярных ошибок: сложные правила, редкие слова, недостатки школьного образования? Можно ли рассматривать ошибки как сигнал для изменения правил? Свой комментарий дала лингвист, член Филологического совета Тотального диктанта Светлана Викторовна Друговейко-Должанская.
...Участники Тотального диктанта — люди, у которых...
...Агнонимы Первая категория наиболее частотных ошибок...
Каждый день мы сталкиваемся с огромным количеством больших и маленьких текстов, но не всегда нам удается сразу осознать прочитанное. Что такое читательская грамотность и почему ее важно развивать? Грамота публикует статью нашего партнера, Всероссийского чемпионата сочинений «Своими словами», которая помогает увидеть сбои в логике, фантазии, преувеличения и неправомерные обобщения там, где при обычном чтении мы не замечаем ничего подозрительного.
...Каждый день мы сталкиваемся с огромным количеством...
...Почему мы можем неверно понять текст Чтобы разобраться...
Словарный запас — это совокупность всех слов, которые знает человек. Какие есть методики его измерения? Правда ли, что современный человек знает больше слов, чем Пушкин? Как богатый словарный запас может помочь в обычной жизни? Расширяем и углубляем представления о словарном запасе вместе с кандидатом филологических наук, руководителем образовательного направления Грамоты Марией Лебедевой.
...Словарный запас — это совокупность всех...
...Два мешка слов «про запас» Исследователи...
Даже грамотные носители русского языка сталкиваются с трудностями, когда им нужно написать редкое, длинное, заимствованное или просто незнакомое слово. Да, в современные устройства встроена автоматическая проверка орфографии, но она не всегда работает корректно и не помогает, когда мы (такое тоже бывает!) пишем важный текст от руки. В случае сомнений всегда лучше свериться со словарем — желательно с самым новым.
...Даже грамотные носители русского языка сталкиваются...
...Что такое орфография Термин орфография восходит к&...
В прошлом году мы уже анализировали несуществующие слова, которые наши читатели пытались найти на портале, и хотим продолжить эту традицию. Наши коллеги выбрали для нас самые удивительные запросы пользователей, а мы попробовали пофантазировать, как возникли эти слова и что они могли бы значить.
...В прошлом году мы уже анализировали несуществующие...
...Под окказионализмами обычно понимают слова, которые...
Стартап Metamentor, основанный студентами МФТИ, создал систему обработки рукописей на базе генеративного искусственного интеллекта. Система уже несколько месяцев тестируется в издательстве «Эксмо». «Алгоритмы анализируют синтаксическую сложность каждого произведения, разнообразие лексики, распознают фрагменты текста, требующие корректировки, исключения или добавления возрастной маркировки в соответствии с действующим законодательством ...
...Стартап Metamentor, основанный студентами МФТИ...
Владикавказский научный центр Российской академии наук (ВНЦ РАН) начал сотрудничество с ведущими российскими ИТ-специалистами с целью расшифровки рукописей нартских сказаний с помощью искусственного интеллекта. Предварительные тесты показали обнадеживающие результаты в работе с историческими документами. В архиве рукописей центра хранится больше десяти тысяч текстов — это одна из крупнейших коллекций такого рода на Северном Кавказе. В 1930–
...Владикавказский научный центр Российской академии наук...
В этих словах нет ничего необычного. Они называют простые, привычные предметы. Блюдце и молоток. Кусок и мешок. Линейка и булавка. Так можно перечислять долго. Лавка, цепочка, цветок... Что общего у всех этих слов? Можно заметить, что у них у всех есть уменьшительный суффикс. О том, что еще их объединяет, рассказывает лингвист Ирина Фуфаева.
...В этих словах нет ничего необычного. Они называют простые...
...Суффиксы в этих словах уже не воспринимаются как уменьшительные...