Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Найти слово сразу в нескольких словарях, сравнить результаты, проверить свою версию написания, произношения или толкования — посетители Грамоты всегда охотно пользовались этой возможностью. Но в некоторых случаях детали не нужны, а требуется, наоборот, быстро получить самое общее представление о слове. Руководитель словарного направления Грамоты Анастасия Александровна Бонч-Осмоловская объясняет, каким образом в метасловаре объединены и структурированы данные о слове и какие преимущества новый формат дает пользователям.
...Найти слово сразу в нескольких словарях, сравнить результаты...
...Метасловарь как агрегатор Задать вопрос справочной...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...
Команда Грамоты за прошедшую неделю внесла несколько обещанных изменений в работу обновленного портала: размер поля для вопроса справочной службе увеличился до 1000 символов; добавлена возможность использовать в поисковой строке символы (* и ?), что позволяет искать в текстовых материалах сразу группу похожих слов; для большинства словарей в словарных статьях, которые появляются в результатах поиска, воспроизводится их исходная разметка. Кроме того, мы теперь с ...
...Команда Грамоты за прошедшую неделю внесла несколько...
Слова, у которых изменилось написание, выбор между «слитно» и «раздельно», новые или разговорные слова, которых еще нет в словарях, — все это сложные случаи, которые могут вызвать затруднения даже у очень грамотных кандидатов филологических наук. Давайте познакомимся поближе с этими опасными экземплярами.
...Слова, у которых изменилось написание, выбор между...
...Старая новая норма «Почему в книге 1952&...
Тематический номер «Северный Кавказ: гора языков и язык гор» посвящен началу Международного десятилетия языков коренных народов, провозглашенного ООН. В нем рассматривается широкий комплекс вопросов, связанных с проблемами сохранения и развития идентичности северокавказских этнических культур.
...Тематический номер «Северный Кавказ: гора языков...
...«Полилингвиальность и транскультурные практики...
Праздник был учрежден более 20 лет назад, в ноябре 1999 года, в целях содействия признанию и использованию родных языков во всем мире. Отмечая Международный день родного языка, ЮНЕСКО напоминает о важности сохранения культурных и языковых различий, которые способствуют терпимости и уважению к другим. В рамках темы Международного дня родного языка в 2022 году «Использование технологий при многоязычном обучении: вызовы и возможности» будет обсуждаться роль технологий в продвижении ...
...Праздник был учрежден более 20 лет назад, в ноябре...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
Онлайн-журнал «Системный Блокъ» рассказал о масштабных нововведениях в НКРЯ: появились новые корпуса и новые функции.
...Онлайн-журнал «Системный Блокъ» рассказал...
...Национальный корпус русского языка (НКРЯ) — ключевой...