Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...При этом модели — если их дообучить ...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...При этом важно, что предложение не разбивается на слова...
Появление языка — один из поворотных моментов эволюции, выделивший человека среди других видов. Но можно ли считать язык исключительно нашим ноу-хау? Последние научные данные говорят о том, что элементы довольно сложных систем коммуникации есть и у других животных. Например, недавно у кашалотов выделили нечто похожее на алфавит. И вот теперь на очереди — слоны. Ранее было известно, что бутылконосые дельфины способны привлекать внимание конкретного ...
...некоторые звуки специфичны для отдельных адресатов и при...
...этом не связаны со звукоподражанием этим особям....
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...При этом понять, как слова языка распределяются по...
Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...При этом квалификационные, другие учебные и научные...
Рабочая группа, в которую вошли сотрудники Института узбекского языка, литературы и фольклора Академии наук Узбекистана, составила список из 30 новых терминов, призванных заменить популярные слова, заимствованные из других языков. Об этом сообщает издание «Газета.uz» со ссылкой на Академию наук. Представители рабочей группы также призвали жителей страны участвовать в дискуссии о заимствованиях и предлагать свои варианты. В список нежелательных заимствований попали ...
...При этом многие англицизмы и латинизмы с большой...
Книжная ярмарка non/fictio№ — это крупное событие для любителей как художественной литературы (fiction), так и литературы всех других жанров (non-fiction). Мы выбрали несколько событий весенней ярмарки, которые могут заинтересовать любителей русского языка и специалистов, которые с ним работают. 12 апреля, в субботу, в 14:00 пройдет паблик-ток «Перевод — дело тонкое: как не сломать жанр». На нем опытные переводчики обсудят особенности работы ...
...тональность для жанра; как не потерять авторский стиль, но при...
...этом адаптировать текст для русскоязычного читателя...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...При этом у человека такого падения не наблюдается...
Специалистов из Медицинской школы Гроссмана Нью-Йоркского университета заинтересовало, что происходит в мозге, когда мы выстраиваем из слов предложение. Для этого они провели эксперимент с десятью пациентами с эпилепсией, которым временно установили электроды прямо в кору мозга (метод называется ECoG — он позволяет очень точно считывать активность мозга в определенных местах). Их обучили произносить определенные слова, а затем собирать из
...Компьютерные модели при этом распознавали сигналы из...
Могут ли слова, лишенные явного смысла, вызывать интерес сами по себе? В случае коммерческих названий, как выяснила международная команда специалистов, это возможно. Для начала они решили узнать, как названия влияют на успех кампаний на платформе Kickstarter. Любой желающий может представить свой проект на этой платформе и объявить сбор пожертвований на его реализацию. Авторы изучили 6487 проектов, сопоставив их названия с данными о собранном ...
... При этом выяснилось, что эффект не работал...