google chrome | Журнал | Поиск по Грамоте

«Говорим по-русски!»: ChatGPT и другие нейросети

Анна Пестова, научный сотрудник отдела современного русского языка Института русского языка им. В. В. Виноградова РАН, и Левон Саакян, доцент кафедры общего и русского языкознания Государственного института русского языка им. А. С. Пушкина, пообщались с нейросетью и делятся этим опытом. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».

...Анна Пестова, научный сотрудник отдела современного...

...Посмотрев видео, вы узнаете: чем отличаются запросы...

Язык дельфинов пробуют расшифровать с помощью искусственного интеллекта

Новая языковая модель на основе искусственного интеллекта DolphinGemma может приблизить ученых к пониманию коммуникации дельфинов. О проекте сообщает блог компании Google, которая реализует его совместно с исследователями из Технологического института Джорджии (США) и организации Wild Dolphin Project (WDP). DolphinGemma обучена на обширной базе записей звуков, которые издают атлантические пятнистые дельфины. Основная цель проекта — не только распознавать щелчки, свисты и ...

...Новая языковая модель на основе искусственного интеллекта...

Компания Alibaba представила собственный ИИ-переводчик для международной торговли

Международная торговая компания Alibaba International Digital Commerce (AIDC) Group, известная как Alibaba, анонсировала запуск новой большой языковой модели Macro MT, разработанной специально для переводов в сфере международной торговли. Решение создать такой сервис в компании приняли после того, как обнаружили, что существующие инструменты перевода не учитывают в полной мере культурные особенности текстов. Модель будет встроена в системы управления ...

...Международная торговая компания Alibaba International...

«Слова года» полгода спустя: кто продолжает забег

В 2024 году Грамота выбирала слово года в несколько этапов, опираясь на три источника данных: предложения наших пользователей, статистику (запросы на портале, данные поисковых систем и нашего партнера СКАН-Интерфакс) и голосование лингвистов. В первый список кандидатов вошли многие популярные слова, в итоге не попавшие в шорт-лист. Мы решили посмотреть, как сложилась судьба самых заметных слов прошлого года: подтверждают ли новые данные наш выбор?

...В 2024 году Грамота выбирала слово года в несколько...

...Финалисты и неудачники Напомним прошлогодний...

«Яндекс.Переводчик» признан лучшим по качеству перевода с английского на русский

По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...

...По итогам тестирования «Яндекс.Переводчик...

Нейросеть выучилась понимать язык без использования текстовых данных

Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...

...Большие языковые модели — нейросети, способные...

Прогноз: текстовые данные для обучения нейросетей могут закончиться в ближайшие годы

В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...

...В течение многих лет такие компании, как OpenAI...

Проект по изучению языка Wordfreq закрылся из-за загрязнения данных нейросетями

В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»

...В середине сентября Робин Спир, создательница проекта...

Маргиналы цифрового мира: можно ли улучшить распознавание редких языков

Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...

...Современные инструменты распознавания языков, такие...

Лучшие программы-корректоры на основе ИИ

В блоке команды чат-бота BotHub на портале «Хабр» вышла статья о том, может ли машинный интеллект находить и исправлять ошибки в русскоязычном тексте, как настоящий корректор. Для испытания автор отобрал 13 популярных инструментов — от передовых языковых моделей до специализированных корректорских сервисов.

...В блоке команды чат-бота BotHub на портале...

...Методология Автор стремился выжать из ИИ-корректоров...

Почитать на грамоте