Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Каждый, кто пишет в газете или популярном журнале о науке, знает, какие мучения вызывает «ввод» научного термина. Часто это слово не знакомо широкому читателю, непонятно даже из контекста и, как правило, воспринимается как «некрасивое» для русского уха и глаза. Сейчас привычные языковые стили меняются, приобретая новые черты. Что представляет собой новый язык науки? Каким становится главное научное слово — термин?
...Каждый, кто пишет в газете или популярном журнале о...
...Сложившийся к началу XX века научный язык — тот...
Русский язык не ограничивается литературным вариантом. В русских деревнях можно услышать разные диалекты, которые сохранили древние черты. В двух выпусках подкаста (1, 2) «Глагольная группа», а также в интервью журналу «Системный Блокъ» лингвист-диалектолог, заместитель директора Института языкознания РАН Игорь Исаев рассказал о своем опыте участия в диалектологических экспедициях.
...Русский язык не ограничивается литературным вариантом...
...Родители Игоря Исаева говорили на разных диалектах:...
Оценивая состояние языка, необходимо разграничивать три вида процессов: 1) в условиях функционирования языка; 2) в построении текста; 3) в системе языка. Раскрепощение, возможность свободно выражать свои мысли и чувства, игры с языком и при помощи языка — вот что характерно для русского языка нашего времени.
...Оценивая состояние языка, необходимо разграничивать...
...В последние десятилетия особенно резко изменились...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
10 сентября в Красноярске начал работу VIII конгресс РОПРЯЛ «Динамика языковых и культурных процессов в современной России». В нем принимают участие более 200 педагогов и представителей образовательного сообщества из 34 регионов России. На площадке Сибирского федерального университета, где проходит конгресс, представлены все федеральные университеты страны. В первый день деловой программы конгресса на нем выступили представители ...
...10 сентября в Красноярске начал работу VIII...
Генеративные нейросетевые модели уже используются в научных текстах, и это не новость. Но насколько активно ученые прибегают к таким инструментам — хотя бы на уровне создания аннотаций к своим статьям? Группа ученых из Германии и США проанализировала более 15 млн англоязычных аннотаций биомедицинских статей из базы PubMed с 2010 по 2024 год. Их интересовали статистически измеримые перемены в
...Генеративные нейросетевые модели уже используются в...
Международная группа исследователей обнаружила, что большие языковые модели, такие как ChatGPT, обрабатывают предложения почти так же, как человеческий мозг, — разбивая их на иерархически упорядоченные блоки-составляющие, а не просто анализируя цепочку слов. Классическая лингвистика со времен Ноама Хомского утверждает, что мозг превращает линейную последовательность слов в иерархическую структуру — дерево, где слова объединяются в группы ...
...Международная группа исследователей обнаружила, что...
В 2025 году Южная Корея предприняла попытку первой в истории масштабной интеграции искусственного интеллекта в школьную программу на государственном уровне. Но инициатива обернулась провалом и к концу года была фактически свернута. Программа, разработанная южнокорейским министерством образования, получила название AI Digital Textbook (цифровые учебники на основе искусственного интеллекта). Власти заявляли, что ИИ станет «помощником учителя», освободив педагогов от ...
...В 2025 году Южная Корея предприняла попытку первой...
Поводом для дискуссии стал публичный отказ издательства «Альпина нон-фикшн» изменить свое название в пользу варианта, зафиксированного еще в 2012 году в «Русском орфографическом словаре». Этот яркий частный случай — часть большой проблемы соотношения нормы и узуса. Но почему именно в словах типа «нон-фикшен», «ресепшен» и «фешен» словарный вариант написания вызывает сопротивление? Грамота решила поговорить об этом со специалистами.
...Поводом для дискуссии стал публичный отказ издательства...
...Группа слов с общей судьбой Есть целая группа...