водолей лечит | Журнал | Поиск по Грамоте

Нейросети проиграли людям при поиске грамматических ошибок

Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...

...Большие языковые модели (чат-боты на основе искусственного...

Михаил Дымарский: «В учении об односоставном предложении есть уязвимые места»

Представление об односоставном предложении до некоторой степени есть у любого человека, который окончил среднюю школу и кое-что помнит из курса русского языка. Но при этом в современной лингвистике задача полного описания односоставных предложений пока не решена.

...Представление об односоставном предложении до некоторой...

...Односоставное предложение — и это признано...

Чат-боты GPT и другие: что думают лингвисты о больших языковых моделях

Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.

...Со второй половины 2010-х годов компьютерные языковые...

...Получившая громкую известность аббревиатура GPT расшифровывается...

Александра Ольховская: «Тематический словарь — это способ найти точное слово для выражения мысли»

Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).

...Как лексиколога и лексикографа меня прежде всего занимают...

...В лексикографии такие словари называют активными. Тематический...

Большие языковые модели оказались чувствительны к вежливости пользователей

Могут ли невежливые запросы снизить качество ответов больших лингвистических моделей вроде ChatGPT? Группа ученых из Университета Васэда (Япония) проверила это предположение на нескольких моделях и трех языках — английском, китайском и японском. В разных языках способы проявления вежливости отличаются. Например, в английском языке есть универсальные слова и конструкции, которые позволяют вежливо обратиться к любому собеседнику. В японском языке ...

...Могут ли невежливые запросы снизить качество ответов...

Новую технологию распознавания сгенерированных текстов разрабатывают в НИУ ВШЭ

Число текстов, сгенерированных искусственным интеллектом, в последние годы растет в геометрической прогрессии. И качество таких текстов постоянно улучшается. А это значит, что определить, к примеру, реальное авторство учебной работы будет все труднее. Ведь текст, порожденный нейросетями, выглядит уникальным, его не распознаёт проверка инструментами вроде «Антиплагиата». Однако справиться с этой задачей обещают исследователи Высшей школы экономики.

...Число текстов, сгенерированных искусственным интеллектом...

Прогноз: текстовые данные для обучения нейросетей могут закончиться в ближайшие годы

В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...

...В течение многих лет такие компании, как OpenAI...

Законопроект о Национальном словарном фонде внесли в Госдуму

Правительство РФ внесло в Госдуму законопроект о создании Национального словарного фонда — единого цифрового ресурса, содержащего данные словарей русского языка. Закон «О государственном языке РФ» предлагается дополнить статьей, которая будет регламентировать создание и работу Национального словарного фонда. Под ним понимается государственная информационная система, в которой будут представлены данные о нормах современного русского ...

...Правительство РФ внесло в Госдуму законопроект...

Ошибка ошибке рознь…

Распространенная сегодня негодующая точка зрения, которую метафорически можно обозначить как «Русский язык мы портим...», не разделяется авторами настоящей публикации. На наш взгляд, сегодня актуален не вопрос о состоянии русского языка, а вопрос о носителе русского языка. Для нас именно носитель, его культура, в том числе и языковая, — проблема (как для изучения, так и для формирования или, если угодно, коррекции).

...Распространенная сегодня негодующая точка зрения, которую...

...Совершенно очевидно, что проблема носителя —...

Разработаны инструменты выявления сгенерированных фрагментов в научных текстах

Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...

...Современные генеративные модели, такие как ChatGPT,...

Почитать на грамоте