В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
В русском языке мы можем по-разному выразить сравнение: используя родительный падеж (золото дороже серебра) или с помощью союза (золото дороже, чем серебро). Портал «Элементы» приводит шесть предложений, в которых сравнение выражено родительным падежом, и предлагает читателю распределить их на две группы, объяснив разницу.
...В русском языке мы можем по-разному выразить сравнение...
...Лингвистические задачи на «Элементах» редко...
С 1 апреля вступил в силу закон, обязывающий детей иностранных граждан и лиц без гражданства подтверждать знание русского языка для поступления в российские школы. Одновременно была запущена процедура тестирования детей. Диагностические материалы разработал Федеральный институт педагогических измерений (ФИПИ). Для детей, поступающих в первый класс, предусмотрена только устная часть, начиная со второго класса добавляется письменная. Потенциальному первокласснику предложат ответить на ...
...С 1 апреля вступил в силу закон, обязывающий детей...
Известный факт: количество названий цветов и оттенков цвета в разных языках отличается. Эти различия в языке, как выясняется, влияют и на наше зрительное восприятие цвета. Совместное исследование Норвежского университета естественных и технических наук и Университета Осло показало, что люди, говорящие на языках с несколькими словами для обозначения оттенков, воспринимают их быстрее. Например, носители русского языка, в котором есть слова голубой и
...Известный факт: количество названий цветов и оттенков...
Всего на конкурс было подано 239 работ из 21 страны мира, в том числе из стран ближнего зарубежья, а также Вьетнама, Индии, Венгрии, Китая, Кубы и Колумбии. «Главный критерий, по которому мы отбираем лауреатов, — их работа не должна быть методической разработкой, какие учителя обычно пишут к урокам, — объясняет председатель жюри конкурса, профессор НИУ ВШЭ Марина Королева. — Она должна быть живой, без общих слов, за ней ...
...Всего на конкурс было подано 239 работ из 21 ...
Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...Современные генеративные модели, такие как ChatGPT,...
Языковеды давно спорят о том, насколько уникальны элементы, составляющие основу человеческой речи. В последние годы появляется всё больше аргументов в пользу того, что речеподобные структуры есть и у других видов. Так, исследования бенгальских вьюрков показывают, что в их пении действуют определенные правила построения последовательностей звуков, которые напоминают базовые принципы человеческой грамматики. Вьюрки не просто издают случайные звуки — их песни состоят из ...
...Языковеды давно спорят о том, насколько уникальны элементы...
Лингвокружок НИУ ВШЭ Занятия кружка ведут студенты Школы лингвистики ВШЭ и других вузов. Школьники получают представление о разнообразии естественных языков, лингвистической типологии, современных достижениях фонетики, морфологии, синтаксиса, семантики, социолингвистики. Слушатели погружаются в проблемы современной компьютерной лингвистики, знакомятся с машинным обучением и его использованием в изучении языка. Занятия бесплатные. Актуальная информация о семинарах публикуется в группе ...
...Лингвокружок НИУ ВШЭ Занятия кружка ведут студенты...
К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Многие встречали утверждение, что мозг якобы игнорирует частицу не. Есть и другой взгляд: частица не меняет смысл слова на противоположный (не очень чистый — грязный), даже если это противоречит смыслу фразы. Благодаря новой работе исследователей из Нью-Йоркского университета появились дополнительные данные о восприятии отрицания. В серии экспериментов участники должны были читать прилагательные с отрицанием и без него (например, хороший —
...Многие встречали утверждение, что мозг якобы игнорирует...