В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...В середине сентября Робин Спир, создательница проекта...
Когда у людей появился язык? Ученые расходятся во мнениях по этому вопросу. Обычно их оценки основываются на данных, полученных в ходе изучения окаменелостей и культурных артефактов. Авторы нового исследования из Массачусетского технологического института выбрали иной подход. Они предположили, что если все языки имеют общее происхождение, то ключевой вопрос заключается в том, когда произошло первое разделение популяций Homo sapiens. Исследователи проанализировали данные 15
...Когда у людей появился язык? Ученые расходятся во мнениях...
Термин «государственный язык» используется в законодательстве, но не имеет однозначного толкования. Что это такое и в чем его функция, каждый понимает по-своему. Ясно одно: «государственный» в этом случае — категория не лингвистическая, а правовая.
...Термин «государственный язык» используется...
...Юридическая история Под языковым законодательством...
Представьте себе словарь, в котором значения слов зависят от возраста читающего, его культурного бэкграунда, политических взглядов и даже формата книги. Именно так обстоят дела с эмодзи — универсальными и одновременно субъективными пиктограммами, которыми каждый день пользуются миллионы людей во всем мире.
...Представьте себе словарь, в котором значения слов зависят...
...Этот материал — часть совместного...
По итогам заседания Совета при Президенте РФ по реализации государственной политики в сфере поддержки русского языка и языков народов РФ Владимир Путин поручил правительству и Совету до 1 мая 2025 года разработать новый закон о языках народов России. В рамках этой инициативы будет создан государственный реестр языков народов страны и проведена систематизация статусов этих языков. Как отмечают «Ведомости», опросившие экспертов, закон о языках народов России уже существует, но он был ...
...По итогам заседания Совета при Президенте РФ по реализации...
Некоторые формы слов в русском языке вызывают у говорящих проблемы: например, невозможно породить форму «мечт» или сказать «Я всех победю!». О том, почему так трудно смириться с дефектной парадигмой, и о причинах, по которым она возникает, рассказывает статья в журнале «Наука и жизнь».
...Некоторые формы слов в русском языке вызывают...
...Русский язык богат на исключения. Например, чего у&...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов говорят о правильном произношении слова «зевота» и о других словах с суффиксом -от-, обычно обозначающих физиологические состояния человека.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Конгресс был приурочен к трехсотлетию Российской академии наук и проводился по инициативе Института языкознания РАН при поддержке Минобрнауки России. Аннотации всех пленарных докладов можно прочитать на сайте конгресса. Мы выбрали несколько интересных событий, которые можно увидеть в записи.
...Конгресс был приурочен к трехсотлетию Российской...
...1. Алексей Гиппиус. Древнерусские берестяные грамоты...
Генеративные нейросетевые модели уже используются в научных текстах, и это не новость. Но насколько активно ученые прибегают к таким инструментам — хотя бы на уровне создания аннотаций к своим статьям? Группа ученых из Германии и США проанализировала более 15 млн англоязычных аннотаций биомедицинских статей из базы PubMed с 2010 по 2024 год. Их интересовали статистически измеримые перемены в
...Генеративные нейросетевые модели уже используются в...