бутефлика абдельазиз | Журнал

Прогноз: текстовые данные для обучения нейросетей могут закончиться в ближайшие годы

В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...

...В течение многих лет такие компании, как OpenAI...

Компания Alibaba представила собственный ИИ-переводчик для международной торговли

Международная торговая компания Alibaba International Digital Commerce (AIDC) Group, известная как Alibaba, анонсировала запуск новой большой языковой модели Macro MT, разработанной специально для переводов в сфере международной торговли. Решение создать такой сервис в компании приняли после того, как обнаружили, что существующие инструменты перевода не учитывают в полной мере культурные особенности текстов. Модель будет встроена в системы управления ...

...Международная торговая компания Alibaba International...

Как пишутся сложные топонимы: правила и исключения

Русская топонимика может показаться запутанной и нелогичной из-за многообразия вариантов написания. Например, почему Переславль-Залесский пишется через дефис, а Ростов Великий — раздельно? Разбираем сложные орфографические случаи и объясняем, с чем может быть связана разница.

...Русская топонимика может показаться запутанной и нелогичной...

...Раздельное написание топонимов Географические названия...

Искусственный интеллект научили создавать конспекты научных статей

Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...

...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...

Язык дельфинов пробуют расшифровать с помощью искусственного интеллекта

Новая языковая модель на основе искусственного интеллекта DolphinGemma может приблизить ученых к пониманию коммуникации дельфинов. О проекте сообщает блог компании Google, которая реализует его совместно с исследователями из Технологического института Джорджии (США) и организации Wild Dolphin Project (WDP). DolphinGemma обучена на обширной базе записей звуков, которые издают атлантические пятнистые дельфины. Основная цель проекта — не только распознавать щелчки, свисты и ...

...Новая языковая модель на основе искусственного интеллекта...

Константин Деревянко: «Необходима национальная стратегия развития речевой культуры»

В последние годы государство уделяет большое внимание языковой политике и законодательству о языке. Были приняты поправки к закону «О государственном языке», идет работа над созданием Национального словарного фонда, утверждена Концепция государственной языковой политики, есть программы сохранения языкового разнообразия России. Какие проблемы сейчас стоят перед обществом, если говорить о русском языке? Каким образом можно было бы эффективно повысить речевую культуру жителей страны? Об этом нам рассказал руководитель Грамоты, член Совета при президенте РФ по русскому языку Константин Деревянко.

...В последние годы государство уделяет большое внимание...

...Грамота: Вы уже много лет занимаетесь издательскими...

«Машинный перевод и прикладная лингвистика» (1964, вып. 8)

Выпуск посвящен семантике русских слов и отражает результаты работы Лаборатории машинного перевода МГПИИЯ в первой половине 1960-х годов. В нем опубликованы работы Александра Жолковского, Нины Леонтьевой, Виктора Розенцвейга, Юрия Щеглова и других исследователей. Сборник на момент написания был ценным вкладом в исследование семантики русского языка и предложил основу для разработки семантических алгоритмов и формальных методов описания значений слов.

...Выпуск посвящен семантике русских слов и отражает результаты...

...Владение смыслом слов проявляется у говорящего в способности...

Приложение на основе ИИ поможет школьникам в изучении русского языка

Приложение «Эльман», основанное на искусственном интеллекте, будет интегрировано в цифровые продукты издательства «Просвещение» для изучения русского языка. Ученики пятых классов смогут задавать чат-боту вопросы о выполнении заданий и получать подсказки, но не прямые ответы. В этом заключается принцип работы приложения: с помощью наводящих вопросов и примеров оно помогает ученикам самим находить решения. Если ученик отвечает верно, ИИ-помощник ...

...Приложение «Эльман», основанное на искусственном...

Понимают ли языковые модели игру слов?

Может ли искусственный интеллект оценить иронию в заголовке «Код накликал» или расшифровать отсылку в фразе «Особо бумажные персоны»? Задача непростая: например, чтобы понять, как устроен заголовок «Миссия сократима», нужно опознать скрытое в нем название фильма и учесть разные значения слова миссия. Чувствительность языковых моделей к каламбурам проверила международная команда лингвистов и экспертов по данным с участием ...

...Может ли искусственный интеллект оценить иронию...

Создать себе подобных: как люди придумали чат-ботов

Кажется, что машины начали вести с нами диалог совсем недавно. На самом деле их история насчитывает несколько десятилетий. Сам термин «чат-бот» появился в 1994 году — его предложил компьютерный инженер Майкл Молдин. А идея программного обеспечения, способного взаимодействовать с людьми на естественном языке, родилась гораздо раньше. Грамота рассказывает о том, как разработчики в разные годы пытались научить бездушные машины общаться по-человечески.

...Кажется, что машины начали вести с нами диалог...

...Работа по сценарию Разработчики будущих чат-ботов...

Почитать на грамоте