Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
28 мая в России в четвертый раз отмечали Международный день ясного языка. Этот день, в числе прочего, — возможность рассказать об особых потребностях некоторых групп людей в области чтения и понимания информации. Именно для этого существует адаптированный вариант языка, называемый ясным. В 2024 году Дом культуры «ГЭС-2» при поддержке благотворительных фондов «Даунсайд Ап» («Синдром любви») и «Лучшие ...
...28 мая в России в четвертый раз отмечали...
Подростки активно используют продукты с генеративным искусственным интеллектом (генИИ) для решения учебных задач, борьбы со скукой и перевода текстов с других языков. При этом родители и учителя отстают от них в понимании этих технологий. Об этом говорят данные опроса Common Sense Media — независимой НКО, которая предоставляет обзоры и рейтинги медиа и технологий с целью информирования общества об их влиянии на детей и подростков1.
...Подростки активно используют продукты с генеративным...
Всего на конкурс было подано 239 работ из 21 страны мира, в том числе из стран ближнего зарубежья, а также Вьетнама, Индии, Венгрии, Китая, Кубы и Колумбии. «Главный критерий, по которому мы отбираем лауреатов, — их работа не должна быть методической разработкой, какие учителя обычно пишут к урокам, — объясняет председатель жюри конкурса, профессор НИУ ВШЭ Марина Королева. — Она должна быть живой, без общих слов, за ней ...
...Всего на конкурс было подано 239 работ из 21 ...
Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...Современные генеративные модели, такие как ChatGPT,...
Языковеды давно спорят о том, насколько уникальны элементы, составляющие основу человеческой речи. В последние годы появляется всё больше аргументов в пользу того, что речеподобные структуры есть и у других видов. Так, исследования бенгальских вьюрков показывают, что в их пении действуют определенные правила построения последовательностей звуков, которые напоминают базовые принципы человеческой грамматики. Вьюрки не просто издают случайные звуки — их песни состоят из ...
...Языковеды давно спорят о том, насколько уникальны элементы...
Книжная ярмарка non/fictio№ — это крупное событие для любителей как художественной литературы (fiction), так и литературы всех других жанров (non-fiction). Мы выбрали несколько событий весенней ярмарки, которые могут заинтересовать любителей русского языка и специалистов, которые с ним работают. 12 апреля, в субботу, в 14:00 пройдет паблик-ток «Перевод — дело тонкое: как не сломать жанр». На нем опытные переводчики обсудят особенности работы ...
...Книжная ярмарка non/fictio№ — это крупное событие...
15 октября начала работу международная дистанционная программа методических мероприятий «Организация курсового обучения русскому языку за рубежом» — одно из крупнейших профессиональных событий в сфере преподавания русского языка за рубежом. На онлайн-открытии программы выступили главный редактор издательства «Златоуст» Анна Голубева, исполнительный директор фонда «Русский мир» Татьяна Шлычкова, председатель Филологического совета ...
...15 октября начала работу международная дистанционная...
Коллектив молодежной лаборатории лингвистической антропологии Камчатского государственного университета им. Витуса Беринга существенно продвинулся в документировании языкового наследия региона. За 2024–2025 годы диалектологи описали 2916 слов камчатского наречия, оцифровали 7,5 часа архивных аудиозаписей. Это часть масштабной работы по созданию электронного ресурса «Краткий словарь русских говоров Камчатки». Территориальная разновидность русского языка на ...
...Коллектив молодежной лаборатории лингвистической антропологии...
К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...