Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В этом году наш портал впервые провел собственную акцию «Слово года». Присоединяясь к этому тренду, Грамота ставит перед собой задачу зафиксировать и проанализировать процессы, которые происходили в течение года в русской лексике, как с точки зрения чисто лингвистических новаций и трендов, так и с точки зрения отражения в лексике общественных настроений и образа жизни носителей русского языка. Выбор слова 2023 года был сделан на основе нескольких критериев: анализа ...
...В этом году наш портал впервые провел собственную акцию...
Найти слово сразу в нескольких словарях, сравнить результаты, проверить свою версию написания, произношения или толкования — посетители Грамоты всегда охотно пользовались этой возможностью. Но в некоторых случаях детали не нужны, а требуется, наоборот, быстро получить самое общее представление о слове. Руководитель словарного направления Грамоты Анастасия Александровна Бонч-Осмоловская объясняет, каким образом в метасловаре объединены и структурированы данные о слове и какие преимущества новый формат дает пользователям.
...Найти слово сразу в нескольких словарях, сравнить результаты...
...Метасловарь как агрегатор Задать вопрос справочной...
Мы все знаем о политике, а вот о языковой политике мало кто знает. Языковая политика — это государственная политика, идеология и соответствующие ей действия, направленные на решение языковых проблем, на достижение определенного языкового состояния в обществе. Традиционно выделяют ретроспективное и перспективное направления в языковой политике. Перспективная языковая политика предполагает так называемое языковое строительство (например, создание алфавитов для бесписьменных языков). Ретроспективное направление — это языковая культура (или культура речи) в самом широком понимании, то есть поддержание норм литературного языка и целенаправленное внедрение их в общество (то есть в носителей языка), культивирование норм среди носителей языка.
...Мы все знаем о политике, а вот о языковой политике...
...Кстати, как вы произносите — в Се́ти или в Сети́...
Чтобы возникла лаконичная и удобная система Брайля, понадобилось объединить достижения человеческой мысли в разных областях: идеи просветителей, усилия педагогов, мастерство криптографов. Спустя двести лет шрифт Брайля не устарел и сегодня востребован в цифровом мире.
...Чтобы возникла лаконичная и удобная система Брайля...
...Новаторы XIX века В 1824 году пятнадцатилетний...
В феврале пользователи, как и всегда, задали нашей справочной службе множество вопросов о том, как применять правила русского языка. Например, интересовались пунктуацией в конструкции «от и до» и в выражении «интерфейс мозг — компьютер». Мы обратили внимание на три вопроса: об оформлении вставки в предложение, о выборе падежа при глаголе и о самых сложных диктантах на русском языке.
...В феврале пользователи, как и всегда, задали нашей...
...Грамматика Вопрос: Предложение Я очень боюсь зубного...
О запуске большого гуманитарного проекта будет официально объявлено в день рождения великого русского лексикографа Владимира Даля. «Слово Толстого» — цифровая платформа, созданная на основе 90-томного полного собрания сочинений Льва Толстого. Проект не только обеспечивает свободный доступ ко всем толстовским текстам (это было сделано на начальном этапе работы с полным собранием сочинений писателя в проекте «Весь Толстой в один клик»), но главное — создает ...
...О запуске большого гуманитарного проекта будет официально...
В эту подборку вошли в основном разного рода словари и энциклопедии для средней и старшей школы, изданные в последние 20 лет, и несколько книг для детей младшего школьного возраста, только начинающих задумываться об устройстве языка, на котором они говорят.
...В эту подборку вошли в основном разного рода словари...
...Книги о лингвистике могут помочь в освоении школьной...