Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
На самом деле этот подкаст — не совсем о русском языке. Девятнадцать коротких выпусков — это истории о том, каким путем в русский язык попали разные непонятные слова и что они означают. Несмотря на некоторые лингвистические неточности, эти увлекательные истории расширяют наше понимание современной речи. Чтобы дать представление о содержании подкаста, опишем вкратце содержание двух выпусков.
...На самом деле этот подкаст — не совсем о...
...Тема первого выпуска — англицизмы,...
В этом году наш портал впервые провел собственную акцию «Слово года». Присоединяясь к этому тренду, Грамота ставит перед собой задачу зафиксировать и проанализировать процессы, которые происходили в течение года в русской лексике, как с точки зрения чисто лингвистических новаций и трендов, так и с точки зрения отражения в лексике общественных настроений и образа жизни носителей русского языка. Выбор слова 2023 года был сделан на основе нескольких критериев: анализа ...
...В этом году наш портал впервые провел собственную акцию...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...Александр Антонов, руководитель группы оценки качества...
Эвфемизмы, или слова-заместители, мы употребляем в тех случаях, когда слово, которое напрашивается в этом контексте, считается непристойным, оскорбительным или неуместным по каким-то другим причинам. И такие «мягкие» формулировки появляются не только на месте ругательств — эвфемизмами заменяют и многие другие лексические единицы. Для каких групп слов они используются чаще всего? Попробуем показать отдельные фрагменты этой большой картины.
...Эвфемизмы, или слова-заместители, мы употребляем в&...
...Не думать об опасном Слово эвфемизм происходит от...
Мы все знаем о политике, а вот о языковой политике мало кто знает. Языковая политика — это государственная политика, идеология и соответствующие ей действия, направленные на решение языковых проблем, на достижение определенного языкового состояния в обществе. Традиционно выделяют ретроспективное и перспективное направления в языковой политике. Перспективная языковая политика предполагает так называемое языковое строительство (например, создание алфавитов для бесписьменных языков). Ретроспективное направление — это языковая культура (или культура речи) в самом широком понимании, то есть поддержание норм литературного языка и целенаправленное внедрение их в общество (то есть в носителей языка), культивирование норм среди носителей языка.
...Мы все знаем о политике, а вот о языковой политике...
...Кстати, как вы произносите — в Се́ти или в Сети́...
В феврале пользователи, как и всегда, задали нашей справочной службе множество вопросов о том, как применять правила русского языка. Например, интересовались пунктуацией в конструкции «от и до» и в выражении «интерфейс мозг — компьютер». Мы обратили внимание на три вопроса: об оформлении вставки в предложение, о выборе падежа при глаголе и о самых сложных диктантах на русском языке.
...В феврале пользователи, как и всегда, задали нашей...
...Грамматика Вопрос: Предложение Я очень боюсь зубного...
В эту подборку вошли в основном разного рода словари и энциклопедии для средней и старшей школы, изданные в последние 20 лет, и несколько книг для детей младшего школьного возраста, только начинающих задумываться об устройстве языка, на котором они говорят.
...В эту подборку вошли в основном разного рода словари...
...Книги о лингвистике могут помочь в освоении школьной...
О запуске большого гуманитарного проекта будет официально объявлено в день рождения великого русского лексикографа Владимира Даля. «Слово Толстого» — цифровая платформа, созданная на основе 90-томного полного собрания сочинений Льва Толстого. Проект не только обеспечивает свободный доступ ко всем толстовским текстам (это было сделано на начальном этапе работы с полным собранием сочинений писателя в проекте «Весь Толстой в один клик»), но главное — создает ...
...О запуске большого гуманитарного проекта будет официально...