изнанка медали | Журнал | Поиск по Грамоте

Лучшие программы-корректоры на основе ИИ

В блоке команды чат-бота BotHub на портале «Хабр» вышла статья о том, может ли машинный интеллект находить и исправлять ошибки в русскоязычном тексте, как настоящий корректор. Для испытания автор отобрал 13 популярных инструментов — от передовых языковых моделей до специализированных корректорских сервисов.

...В блоке команды чат-бота BotHub на портале...

...Методология Автор стремился выжать из ИИ-корректоров...

О неизданном «Словаре к пьесам А. Н. Островского»

Русский драматург Александр Николаевич Островский был большим любителем народного слова и с интересом собирал незнакомые ему слова и выражения. Результатом его наблюдений за живой речью стали «Материалы для словаря русского народного языка». В 1993 году вышел основанный на этих материалах «Словарь к пьесам А. Н. Островского», который содержит историко-бытовой, историко-театральный и филологический комментарии. Борис Самойлович Шварцкопф подробно описал этот словарь нового типа в 1973 году, за двадцать лет до того, как он был опубликован.

...Русский драматург Александр Николаевич Островский был...

...В научной библиотеке Всероссийского театрального общества...

«Муж объелся груш» и другие речевые формулы для ответа в рифму

В июне наша справочная служба побила все рекорды и ответила на 865 вопросов пользователей! Из них мы выбрали четыре, чтобы рассказать об одном из проявлений игровой природы языка, напомнить правила написания названий некоторых редакторских профессий и разобраться с дробными числительными и существительными, которыми они управляют.

...В июне наша справочная служба побила все рекорды и&...

...Управление Вопросы: 1. Как правильно следует...

Исследование: внутренний язык больших языковых моделей ближе всего к английскому

Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...

...Большинство нейросетевых языковых моделей обучаются...

Разработаны инструменты выявления сгенерированных фрагментов в научных текстах

Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...

...Современные генеративные модели, такие как ChatGPT,...

Благодаря языку незрячие чувствуют значение цветов не хуже зрячих

Определенные цвета вызывают у нас устойчивые ассоциации: красный — горячий, синий — холодный, и т. д. Эти связи часто формируются на основе визуального опыта. Красный — это цвет пламени, тлеющих углей, закатного солнца; синий, голубой ассоциируются с холодом льда, водной гладью, ночной прохладой. Но могут ли такие же ассоциации возникнуть у тех, кто никогда не видел ни неба, ни солнца, ни пламени? Оказывается — да, и происходит это благодаря ...

...Определенные цвета вызывают у нас устойчивые ассоциации...

Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.

...Нейросети учатся на текстах, созданных человеком. Но...

...Грамота: Одна из страшилок, связанных с развитием...

Математик Константин Воронцов: «Текст становится тормозом развития цивилизации»

Революция нейросетей началась с текста. Но в будущем, вероятно, его роль как носителя знаний будет уменьшаться. На смену ему придут текстографические форматы, и это позволит людям быстрее понимать задачи и достигать взаимопонимания. Об этом в интервью Грамоте размышляет специалист по цифровой гуманитаристике, доктор физико-математических наук Константин Воронцов.

...Революция нейросетей началась с текста. Но в ...

...Грамота: В 2024 году Нобелевскую премию по...

Маргиналы цифрового мира: можно ли улучшить распознавание редких языков

Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...

...Современные инструменты распознавания языков, такие...

Чем сгенерированные тексты (пока еще) выдают себя

Когда-то мы смеялись над корявостью и глупостью первых языковых моделей. Сегодня чат-боты пишут за людей деловые письма и посты, сочиняют рассказы, ведут задушевные беседы и приводят аргументы в спорах. Есть ли что-то, чем речь машины в корне отличается от человеческой? И может ли эксперт — или даже другая машина — обнаружить эту разницу?

...Когда-то мы смеялись над корявостью и глупостью первых...

...Гладко, но безжизненно Машина пишет текст не ...

Почитать на грамоте