Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Недавнее исследование, проведенное учеными из ...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Предлагаем подумать над тремя задачами, которые опубликованы на научно-популярном портале «Элементы»: одна посвящена ненецким числительным, вторая — мосальскому диалектному яканью, а третья — особенностям папуасского языка каки аэ (лорабада).
...Предлагаем подумать над тремя задачами, которые опубликованы...
...Когда разные народы живут бок о бок, то их языки...
Портал «Элементы» предлагает поломать голову над новыми задачами: проанализировать закономерности отражения праиндоевропейских звуков в славянских языках, выявить русские заимствования в польском и польские в русском среди слов, которые восходят к общему корню, а также перевести фразы с русского на язык маори и наоборот.
...Портал «Элементы» предлагает поломать голову...
...Язык из ниоткуда Задача от лингвиста Александра Пиперски...
Исследователи из Центра языка и мозга Высшей школы экономики (ЦЯиМ НИУ ВШЭ) представили новый инструмент диагностики дислексии — тест, адаптированный для взрослого человека с этой особенностью. Как отмечает руководитель Лаборатории чтения «Верные слова» Анна Левинзон, инструменты для диагностики дислексии у взрослых крайне востребованы. По ее словам, «коррекция нарушений чтения во взрослом возрасте малореалистична, поскольку требует очень ...
...Исследователи из Центра языка и мозга Высшей...
Традиционная олимпиада по лингвистике (она же Московская олимпиада школьников по лингвистике) — это крупное интеллектуальное состязание, которое открывает дорогу в большую науку молодым талантам. В этом году она пройдет в 56-й раз. Олимпиада открыта для учащихся 8–11 классов независимо от их места проживания, а также допускает участие школьников седьмых и даже более младших классов (по заданиям для восьмых классов). В задачах ...
...Традиционная олимпиада по лингвистике (она ...
Может ли искусственный интеллект оценить иронию в заголовке «Код накликал» или расшифровать отсылку в фразе «Особо бумажные персоны»? Задача непростая: например, чтобы понять, как устроен заголовок «Миссия сократима», нужно опознать скрытое в нем название фильма и учесть разные значения слова миссия. Чувствительность языковых моделей к каламбурам проверила международная команда лингвистов и экспертов по данным с участием ...
...Может ли искусственный интеллект оценить иронию...
Распространенная сегодня негодующая точка зрения, которую метафорически можно обозначить как «Русский язык мы портим...», не разделяется авторами настоящей публикации. На наш взгляд, сегодня актуален не вопрос о состоянии русского языка, а вопрос о носителе русского языка. Для нас именно носитель, его культура, в том числе и языковая, — проблема (как для изучения, так и для формирования или, если угодно, коррекции).
...Распространенная сегодня негодующая точка зрения, которую...
...Совершенно очевидно, что проблема носителя —...
Публицистика как вид литературы сохраняет свои основные черты на протяжении столетий. Однако время вносит серьезные изменения в характер функционирования публицистических произведений. Нестабильность социальной ситуации переживаемого нами периода оказывает немаловажное влияние на публицистику, на ее речевой облик, стилевые устремления, язык.
...Публицистика как вид литературы сохраняет свои основные...
...Общеизвестно, что язык создается по мерке человека....