Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Если не учитывать историю происхождения слов, то даже в тех случаях, когда их родство очевидно носителям русского языка, их формально нельзя назвать однокоренными. Лингвист Борис Иомдин в журнале «Русская речь» предлагает использовать более гибкую методику оценки школьных заданий на сравнение корней.
...Если не учитывать историю происхождения слов, то даже...
...Если в слове воробей мы выделим корень -воробей...
Может ли искусственный интеллект оценить иронию в заголовке «Код накликал» или расшифровать отсылку в фразе «Особо бумажные персоны»? Задача непростая: например, чтобы понять, как устроен заголовок «Миссия сократима», нужно опознать скрытое в нем название фильма и учесть разные значения слова миссия. Чувствительность языковых моделей к каламбурам проверила международная команда лингвистов и экспертов по данным с участием ...
...Может ли искусственный интеллект оценить иронию...
Пушкин — наше всё, солнце русской поэзии и символ русской культуры, создатель современного русского литературного языка… Но в чем именно состояла его роль? Что он изменил в языке, что привнес нового, а что отверг, как повлиял на литературные вкусы и языковые нормы, что думал о заимствованиях и просторечии? Пушкинский день располагает к тому, чтобы подумать об этом.
...Пушкин — наше всё, солнце русской поэзии и символ...
...Споры о языке В начале XIX века в Петербурге происходили...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Когда взрослые разговаривают друг с другом, они опираются на свои знания и предположения о том, как и о чем будет (скорее всего) говорить другой человек. Это облегчает им задачу по расшифровке звуковой информации, особенно когда голос собеседника приглушен, плохо слышен на фоне шума, речь неразборчива или ее пониманию мешает сильный акцент. В новом исследовании Массачусетского технологического института и Гарвардского университета, опубликованном в журнале Nature Human ...
...Когда взрослые разговаривают друг с другом, они опираются...
Предлагаем вниманию читателей статью Бориса Николаевича Головина, опубликованную в журнале «Русский язык в школе» (№ 2, 1964). Размышления ученого о проблемах кодификации нормы, отличиях между ее колебаниями и нарушениями, о критериях правильности, чистоты, богатства и разнообразия речи, об опасности засорения литературного языка канцеляризмами и жаргонами актуальны и спустя полвека.
...Предлагаем вниманию читателей статью Бориса Николаевича...
...Предисловие «Грамоты.ру» Борис Николаевич...
Глагол «трусить» — это на самом деле два глагола-омографа, которые пишутся одинаково, а произносятся по-разному. Более того, у одного из этих глаголов есть два значения, о чем напоминает журнал «Наука и жизнь».
...Глагол «трусить» — это на самом деле...
...Если в глаголе трусить поставить ударение на первый...
Согласно свежим данным проекта Ethnologue 2025, глобальный языковой ландшафт продолжает стремительно меняться. Английский окончательно закрепился в статусе универсального инструмента межнационального общения. Лишь для четверти тех, кто им пользуется, он является родным. Остальные 1,1 млрд выучили его для работы, учебы и путешествий. Этот тренд затрагивает и русский язык: из 253 млн человек около 108 млн используют его как второй, что подтверждает его статус ...
...Согласно свежим данным проекта Ethnologue 2025, глобальный...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...