мотеле | Журнал | Поиск по Грамоте

Большие языковые модели оказались чувствительны к вежливости пользователей

Могут ли невежливые запросы снизить качество ответов больших лингвистических моделей вроде ChatGPT? Группа ученых из Университета Васэда (Япония) проверила это предположение на нескольких моделях и трех языках — английском, китайском и японском. В разных языках способы проявления вежливости отличаются. Например, в английском языке есть универсальные слова и конструкции, которые позволяют вежливо обратиться к любому собеседнику. В японском языке ...

...Могут ли невежливые запросы снизить качество ответов...

Как образуются новые слова: старые модели, новые потребности

Источники и причины появления новых слов Многие слова, которые мы сегодня воспринимаем как привычные и существовавшие всегда, когда-то были новыми единицами. Так, слово столица образовано от слова стол при помощи суффикса -иц-, но со временем эта связь перестала ощущаться: сегодня мы не видим в слове столица то значение, которое есть у стола. А во многих случаях слова, когда-то послужившие основой для новых, сами ушли из языка: говядина (от ст.-слав. говѩдо — крупный рогатый ...

...Источники и причины появления новых слов Многие слова...

Маргиналы цифрового мира: можно ли улучшить распознавание редких языков

Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...

...Современные инструменты распознавания языков, такие...

Распространение генеративных моделей делает проверку текстов на плагиат недостаточной

В рамках исследования авторы работы (сотрудники двух факультетов МГУ — иностранных языков и регионоведения, вычислительной математики и кибернетики) протестировали способность пяти ведущих больших языковых моделей — ChatGPT-4, Gemini-pro-1.5, Claude 3 Opus, Llama3-70b и Microsoft Phi-3 — выполнять письменные задания из популярных учебников, выпущенных издательствами Oxford University Press и Pearson Education. Моделям требовалось выполнить следующие ...

...В рамках исследования авторы работы (сотрудники...

Польский и русский оказались эффективнее английского при поиске информации

Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —

...Недавнее исследование, проведенное учеными из ...

Опубликованы российские результаты оценки функциональной грамотности учащихся по модели PISA

На портале Федерального института оценки качества образования опубликован отчет о результатах общероссийской оценки качества общего образования по модели международных сопоставительных исследований качества образования за 2023 год. Такая оценка проводится в России ежегодно с 2019 года. В этот раз результаты (в общероссийской и региональных выборках) основаны на анкетировании 61,5 тыс. обучающихся, сотен администраций образовательных ...

...На портале Федерального института оценки качества образования...

Прогноз: текстовые данные для обучения нейросетей могут закончиться в ближайшие годы

В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...

...В течение многих лет такие компании, как OpenAI...

Белгородские лингвисты представили лингала-русский разговорник

Ученые-лингвисты Белгородского государственного университета совместно с представителями Ассоциации экономического сотрудничества со странами Африки (АЭССА) впервые издали разговорник для общения с африканцами, говорящими на языке лингала (они живут в Демократической Республике Конго, на большей части территории Республики Конго, а также в Анголе, Центральноафриканской Республике и на юге Южного Судана). Об этом сообщила в своем блоге ректор БелГУ ...

...Ученые-лингвисты Белгородского государственного университета...

Минимум 13% аннотаций к научным статьям создается с помощью нейросетей

Генеративные нейросетевые модели уже используются в научных текстах, и это не новость. Но насколько активно ученые прибегают к таким инструментам — хотя бы на уровне создания аннотаций к своим статьям? Группа ученых из Германии и США проанализировала более 15 млн англоязычных аннотаций биомедицинских статей из базы PubMed с 2010 по 2024 год. Их интересовали статистически измеримые перемены в

...Генеративные нейросетевые модели уже используются в...

Люди и ChatGPT одинаково «видят» структуру предложений

Международная группа исследователей обнаружила, что большие языковые модели, такие как ChatGPT, обрабатывают предложения почти так же, как человеческий мозг, — разбивая их на иерархически упорядоченные блоки-составляющие, а не просто анализируя цепочку слов. Классическая лингвистика со времен Ноама Хомского утверждает, что мозг превращает линейную последовательность слов в иерархическую структуру — дерево, где слова объединяются в группы ...

...Международная группа исследователей обнаружила, что...

Почитать на грамоте