Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Поиск по берестяным грамотам на слово «грамота...
...В некоторых корпусах есть поиск по синтаксическим признакам...
Мы с несколькими коллегами работаем над новым двуязычным русско-немецким и немецко-многоязычным (в том числе русским) онлайн-словарем синтаксических фразеологизмов. В течение следующего года мы планируем достичь объема триста словарных статей по каждому из двух языков и опубликовать первую версию словаря, но будем продолжать над ним работать и его пополнять.
...Мы с несколькими коллегами работаем над новым двуязычным...
...недостаточно фиксируются в текстовых корпусах, а их поиск...
Все исследователи языка сходятся во мнении, что мы переживаем время резкой активизации жаргона (арго, сленга). Жаргонизмы переполняют речь людей, СМИ, художественную литературу. В связи с этим возникает ряд вопросов, на которые согласился ответить автор «Словаря московского арго», профессор МГУ и доктор культурологии Владимир Станиславович Елистратов.
...Все исследователи языка сходятся во мнении, что мы...
...Идет интенсивный и неупорядоченный поиск средств выражения...
«И я думаю: как прекрасен этот мир», — пел Луи Армстронг. Способность размышлять, строить планы, оценивать мир с помощью слов для большинства из нас совершенно естественна. Но есть те, кому внутренняя речь недоступна — вплоть до того, что они считают ее художественным вымыслом. Авторы недавнего исследования решили проверить, как отсутствие внутренней речи влияет на способность запоминать слова и решать другие когнитивные задачи. Это состояние, при ...
...Второй эксперимент предполагал поиск рифмы....
Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Исследователи предполагают, что дело случае задач на поиск...
Орфографический словарь «Академос» Института русского языка имени В. В. Виноградова РАН подвел итоги года: за 2025-й в него добавили 921 новую словарную статью. Это значит, что сотни слов, которые мы используем каждый день, наконец получили официальную орфографическую кодификацию. Среди декабрьских пополнений — 264 статьи, отражающие самые разные пласты современной лексики. В подборку актуальной лексики попали такие слова, как ...
...новых слов за 2025 год можно получить через поиск...
В литературных текстах прошлого есть странные для современного читателя цветообозначения. Кандидат филологических наук, переводчик и прозаик Мария Елифёрова в книге «Тайна синего вина и другие филологические истории» проясняет несколько загадок, связанных с цветом (и не только) в мировой литературе.
...В литературных текстах прошлого есть странные для современного...
...реалистичное представление о том, как выглядит научный поиск...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...По сути дела, это тоже информационный поиск, только...
...областях, как машинный перевод или даже информационный поиск...
Каким должен быть русский язык? Какое место в нем должны занимать новые слова и заимствования, уместны ли в русском языке феминитивы и какого рода слово «кофе» — эти темы традиционно вызывают самые горячие споры. На некоторые вопросы о лингвомифах и речевых ошибках отвечает книга Светланы Гурьяновой.
...Каким должен быть русский язык? Какое место в нем должны...
...Первая часть книги — «поиск той самой золотой...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя. Это справочно-информационная платформа, созданная на основе девяностотомного собрания сочинений Льва Толстого, которая дает пользователю возможность проводить поиск по огромному корпусу текстов писателя, предоставляет справочные материалы как для специалистов, так и для широкого круга читателей. 19 ноября 2024 года проект презентовал цифровую хронику жизни Льва Толстого, основанную на ...
..., которая дает пользователю возможность проводить поиск...