Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Анна Константиновна Поливанова рассказала проекту Arzamas о своем детстве, об отношениях с учителями, взглядах на язык и принципах рациональной науки. Этот большой разговор будет интересен не только лингвистам.
...Анна Константиновна Поливанова рассказала проекту...
...Учителями Анны Поливановой были Андрей Зализняк, Юрий...
Международная группа математиков и историков из Великобритании и США представила систему искусственного интеллекта, способную восстанавливать частично утраченные надписи на латинском языке. Разработка, получившая название «Эней» (в честь легендарного героя Троянской войны), уже продемонстрировала высокую точность реконструкции — 90% успешных случаев. Об этом сообщает публикация в авторитетном научном журнале Nature. Для обучения ...
...Международная группа математиков и историков из...
Проект, запущенный в прошлом году импринтом «Лингва» (входит в структуру «АСТ нонфикшн»), издательством «Мир и Образование» и филологическим проектом «Скворцовские чтения», приступил к выбору главных слов 2025 года. Словом 2024 года по версии этого проекта стало слово мир. Согласно анонсу на сайте Литературного института имени А. М. Горького, слова года будут определять по четырем направлениям: «Гуманитарная сфера», «
...Проект, запущенный в прошлом году импринтом «...
Российская Федерация — многонациональное государство. На ее территории функционируют более 150 языков, из которых около ста — языки коренных народов России, остальные — это языки компактно или диаспорно проживающих некоренных этносов. Полиэтничность Российского государства выражена в начальных строках Конституции: «Мы — многонациональный народ России».
...Российская Федерация — многонациональное...
...Государственно-политические аспекты лингвокультурной...
На сайте Русского географического общества опубликовано интервью с кандидатом филологических наук, старшим научным сотрудником Института языкознания РАН и специалистом по лингвистической картографии Юрием Коряковым.
...На сайте Русского географического общества опубликовано...
...Идея создания «Карты языков России» возникла...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
После ста с лишним лет безуспешных попыток удалось расшифровать основной подтип дофарской письменности — древней системы письма, обнаруженной в Дофаре (одной из провинций Омана). Исследование, опубликованное в журнале Jaarbericht Ex Oriente Lux, описывает прорывное открытие в понимании этой системы письма. Когда лингвист Ахмад Аль-Джаллад из Университета штата Огайо (США) изучал фотографии дофарских надписей, он обратил внимание на один из ...
...После ста с лишним лет безуспешных попыток удалось...
11 августа 2025 года заместитель председателя IT-комитета Госдумы Андрей Свинцов представил законопроект о блокировке цифрового контента, содержащего нецензурную брань. Депутат предлагает внести поправки в закон «Об информации, информационных технологиях и защите информации», согласно которым любой цифровой контент с нецензурной лексикой подлежит блокировке по решению органов прокуратуры. В пояснительной записке отмечается, что Кодекс об
...11 августа 2025 года заместитель председателя...