2023 год стал вызовом для наук о языке во всем мире. Оказалось, что большие языковые модели (самый известный их представитель — ChatGPT) гораздо лучше справляются с порождением осмысленных высказываний и текстов, чем модели, которые предлагались до этого внутри лингвистики. В результате мнения специалистов о новых технологических достижениях разделились: одни их игнорируют или оспаривают их результаты, другие пытаются концептуально осмыслить и даже ...
...2023 год стал вызовом для наук о языке во...
В блоке команды чат-бота BotHub на портале «Хабр» вышла статья о том, может ли машинный интеллект находить и исправлять ошибки в русскоязычном тексте, как настоящий корректор. Для испытания автор отобрал 13 популярных инструментов — от передовых языковых моделей до специализированных корректорских сервисов.
...В блоке команды чат-бота BotHub на портале...
...Методология Автор стремился выжать из ИИ-корректоров...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...Современные генеративные модели, такие как ChatGPT,...
Определенные цвета вызывают у нас устойчивые ассоциации: красный — горячий, синий — холодный, и т. д. Эти связи часто формируются на основе визуального опыта. Красный — это цвет пламени, тлеющих углей, закатного солнца; синий, голубой ассоциируются с холодом льда, водной гладью, ночной прохладой. Но могут ли такие же ассоциации возникнуть у тех, кто никогда не видел ни неба, ни солнца, ни пламени? Оказывается — да, и происходит это благодаря ...
...Определенные цвета вызывают у нас устойчивые ассоциации...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Революция нейросетей началась с текста. Но в будущем, вероятно, его роль как носителя знаний будет уменьшаться. На смену ему придут текстографические форматы, и это позволит людям быстрее понимать задачи и достигать взаимопонимания. Об этом в интервью Грамоте размышляет специалист по цифровой гуманитаристике, доктор физико-математических наук Константин Воронцов.
...Революция нейросетей началась с текста. Но в ...
...Грамота: В 2024 году Нобелевскую премию по...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
«Сбер» и SberDevices совместно с некоммерческой организацией «Центр образования и исследования жестового языка» запустили социально-образовательный проект — видеословарь для изучения русского жестового языка (РЖЯ). В словарь вошли около 400 жестов, примерно соответствующих 660 словам русского языка. Сейчас сайт позволяет выбрать слово поиском или из списка, а затем просмотреть соответствующее видео — в
...«Сбер» и SberDevices совместно с ...