Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Сервис управления соцсетями LiveDune совместно с СПбГУ провел масштабное исследование современного российского интернет-сленга. Набор данных включал 56 млн комментариев, оставленных в самых популярных в России социальных сетях. Выявлением сленга занималась нейросеть «Ольга Станиславовна», созданная командой LiveDune специально для оценки тональности соцсетевого контента. Авторы проанализировали частотность использования сленговых слов и составили рейтинг самых распространенных.
...Сервис управления соцсетями LiveDune совместно с СПбГУ...
В новом номере журнала «Русская речь» наше внимание привлекли две статьи: Дарьи Харламовой и Татьяны Резниковой о семантической эволюции устойчивого выражения куда ни кинь и Анастасии Завадской о неологизмах коронавирусной эпохи.
...В новом номере журнала «Русская речь»...
...Семантическая эволюция устойчивого выражения куда ни...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...
Раскройте любое издание, включите любой телеканал — и перед вами развернутся целые миры, о существовании которых вы могли и не подозревать. «Глобальные» претензии современной рекламы (зачастую абсурдные) отображает московский рекламный еженедельник «Экстра М»: «Мир кожи в Сокольниках» и «Электромир», «Мир потолка», «Мир окон» и «Мир ванн» (это названия московских магазинов). Группа компаний «Инрост», продавая обогреватели, зовет в «Мир идеального климата», «Весь мир Canon в магазинах „Конверс“!», «Мир мобильной связи» и «Волшебный мир компьютеров» (это слоганы — рекламные девизы).
...Раскройте любое издание, включите любой телеканал ...
...Реклама — новая реальность И это современное...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя. Это справочно-информационная платформа, созданная на основе девяностотомного собрания сочинений Льва Толстого, которая дает пользователю возможность проводить поиск по огромному корпусу текстов писателя, предоставляет справочные материалы как для специалистов, так и для широкого круга читателей. 19 ноября 2024 года проект презентовал цифровую хронику жизни Льва Толстого, основанную на ...
...Проект «Слово Толстого» — цифровой...
Наша чувствительность к языкам — удивительная черта, которая позволяет нам быстро овладевать речью. Считается, что раннее освоение языка состоит из двух этапов. В ходе первого младенцы учатся отличать звуки родительского языка от посторонних звуков, другими словами, развивают чувствительность к звучанию именно того языка, на котором будут говорить. Этот процесс принято называть перцептивной настройкой (от perception — восприятие, схватывание). На втором этапе ребенок ...
...Наша чувствительность к языкам — удивительная...
26 мая скончалась Елена Яковлевна Шмелева — кандидат филологических наук, заместитель директора Института русского языка им. В. В. Виноградова РАН, специалист по семантике и культуре речи, орфографии и лексикографии, словообразованию и преподаванию русского языка. Ей было 67 лет. Выпускница отделения структурной и прикладной лингвистики филологического факультета МГУ им. М. В. Ломоносова 1979 года, в том же году поступила в аспирантуру Института русского ...
... 26 мая скончалась Елена Яковлевна Шмелева...
По разным оценкам, взрослых с дислексией в России от четырех до одиннадцати миллионов. Точное число не знает никто — из-за нехватки стандартизированных диагностических инструментов на русском языке. При этом дислексия существенно влияет на качество жизни: может вызвать трудности в интернет-общении (а при дистанционной работе это особенно актуально), сложности на работе, насмешки, ошибки при составлении или понимании документов. Специалисты Центра языка и мозга (ЦЯиМ) НИУ ВШЭ разработали ...
...По разным оценкам, взрослых с дислексией в России от...