Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В 2023 году были внесены изменения в Федеральный закон «О государственном языке Российской Федерации». Новая редакция предписывает использовать заимствованные слова только в случае отсутствия русских аналогов. О том, как создавался новый нормативный словарь иностранных слов, а также о том, как меняется русский язык, газете «Санкт-Петербургские ведомости» рассказала доктор филологических наук, заместитель директора по научной работе Института лингвистических исследований РАН Марина Приемышева.
...В 2023 году были внесены изменения в Федеральный...
...Цель создания нормативного словаря иностранных слов...
Международная группа исследователей обнаружила, что большие языковые модели, такие как ChatGPT, обрабатывают предложения почти так же, как человеческий мозг, — разбивая их на иерархически упорядоченные блоки-составляющие, а не просто анализируя цепочку слов. Классическая лингвистика со времен Ноама Хомского утверждает, что мозг превращает линейную последовательность слов в иерархическую структуру — дерево, где слова объединяются в группы ...
...Международная группа исследователей обнаружила, что...
В последнее время устаревшая церковнославянская и конфессиональная лексика активно используются современными массмедиа. Рассчитанные на массового читателя и слушателя, современные массово-коммуникативные тексты, воспроизводя стандартные языковые модели, обращаются к устаревшей лексике для большей эмоциональности, экспрессивности.
...В последнее время устаревшая церковнославянская и конфессиональная...
...Исследователь проблем современного русского языка Е...
Нивхский — один из малых языков России, на котором почти перестали разговаривать его носители. О том, как нейросети и голосовые помощники помогают сохранить нивхский, а в перспективе могут улучшить ситуацию и с другими языками малочисленных народов, в интервью изданию «Научная Россия» рассказал руководитель лаборатории, доктор филологических наук Павел Гращенков.
...Нивхский — один из малых языков России,...
...Павел Гращенков руководит Лабораторией автоматизированных...
Рукопись была случайно обнаружена в 2019 году в библиотеке Кембриджского университета — из нее сделали обложку хозяйственного реестра. Страницы были сложены, порваны и вшиты в переплет, так что традиционные методы реставрации могли бы нанести документу непоправимый ущерб. Команда исследователей из университетской Лаборатории визуализации культурного наследия (CHIL) использовала комплексную технику цифровой реставрации, чтобы не только восстановить текст, но и пролить свет на историю ...
...Рукопись была случайно обнаружена в 2019 году...
Ведущая рубрики «Русский устный», член редакционного совета портала «Грамота.ру» Юлия Сафонова рассказывает об истории слова «промокашка» и разных других слов, связанных с историей старых принадлежностей для письма; также объясняется разница в значении глагола «промокнуть» в зависимости от ударения.
...Ведущая рубрики «Русский устный», член редакционного...
Почему матерная лексика становится менее табуированной в современном мире и как к этому относиться? Об этом ведущий подкаста «Собрались с мыслями» на Первом канале Владимир Легойда поговорил с руководителем Грамоты Константином Деревянко и деканом факультета международной журналистики МГИМО Ярославом Скворцовым.
...Почему матерная лексика становится менее табуированной...
...В последнее время активно обсуждается засилье...
Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Недавнее исследование, проведенное учеными из ...
В список нынешнего года вошли существительные лимб, проявленность, зумер, ред-флаг, сигма, имба, выгорание, промпт, слоп, брейнрот, а также междометие пупупу и глагол подсветить. Лингвисты рассмотрели более 500 слов, из которых 63 соответствовали основным критериям: недавнее появление в языке или развитие нового значения в последние несколько лет; заметный рост упоминаемости в социальных сетях, в онлайн-СМИ и на интернет-страницах в 2025 году, а ...
...В список нынешнего года вошли существительные...