Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
На самом деле этот подкаст — не совсем о русском языке. Девятнадцать коротких выпусков — это истории о том, каким путем в русский язык попали разные непонятные слова и что они означают. Несмотря на некоторые лингвистические неточности, эти увлекательные истории расширяют наше понимание современной речи. Чтобы дать представление о содержании подкаста, опишем вкратце содержание двух выпусков.
...На самом деле этот подкаст — не совсем о...
...Тема первого выпуска — англицизмы,...
В этом году наш портал впервые провел собственную акцию «Слово года». Присоединяясь к этому тренду, Грамота ставит перед собой задачу зафиксировать и проанализировать процессы, которые происходили в течение года в русской лексике, как с точки зрения чисто лингвистических новаций и трендов, так и с точки зрения отражения в лексике общественных настроений и образа жизни носителей русского языка. Выбор слова 2023 года был сделан на основе нескольких критериев: анализа ...
...В этом году наш портал впервые провел собственную акцию...
Полчаса на редактуру мало, редактирование — медленный процесс. Но скорость жизни в последнее десятилетие повысилась, а количество текстов увеличилось. Типичный редакторский кошмар: «У меня всего полчаса на этот текст». Наш чек-лист поможет сосредоточиться, когда приближается дедлайн, а вы не знаете, за что хвататься.
...Полчаса на редактуру мало, редактирование &mdash...
...Максимум возможного за минимум времени Развитие цифровых...
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
...Появление интернета изменило в том числе и привычные...
...Что такое Национальный словарный фонд: концепция и...
Наши представления о Древней Руси во многом сформированы «Повестью временных лет», которая не всегда может служить достоверным историческим источником. Споры о роли скандинавов в создании древнерусского государства продолжались веками. Недостаток источников создал почву для развития псевдоисторических идей и любительской лингвистики. Но того, что известно исследователям, достаточно, чтобы проследить судьбу важных русских корней рус- и рос-.
...Наши представления о Древней Руси во многом сформированы...
...Этимология: фантазии и факты Наверняка многие слышали...
В феврале 2024 года Российская академия наук отмечает трехсотлетие. РАН традиционно пользуется уважением, академизм считается синонимом основательности и научной строгости, быть академиком почетно. Но реальную картину академической жизни и смысл работы ученых многие представляют себе смутно. Грамота решила добавить ясности и обратилась к филологам — членам Академии, которые хорошо знают историю науки и могут судить о ее сегодняшнем состоянии изнутри.
...В феврале 2024 года Российская академия наук отмечает...
...Чем академическая наука отличается от других «...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...Александр Антонов, руководитель группы оценки качества...
Эвфемизмы, или слова-заместители, мы употребляем в тех случаях, когда слово, которое напрашивается в этом контексте, считается непристойным, оскорбительным или неуместным по каким-то другим причинам. И такие «мягкие» формулировки появляются не только на месте ругательств — эвфемизмами заменяют и многие другие лексические единицы. Для каких групп слов они используются чаще всего? Попробуем показать отдельные фрагменты этой большой картины.
...Эвфемизмы, или слова-заместители, мы употребляем в&...
...Не думать об опасном Слово эвфемизм происходит от...