В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Международная торговая компания Alibaba International Digital Commerce (AIDC) Group, известная как Alibaba, анонсировала запуск новой большой языковой модели Macro MT, разработанной специально для переводов в сфере международной торговли. Решение создать такой сервис в компании приняли после того, как обнаружили, что существующие инструменты перевода не учитывают в полной мере культурные особенности текстов. Модель будет встроена в системы управления ...
...Международная торговая компания Alibaba International...
Русская топонимика может показаться запутанной и нелогичной из-за многообразия вариантов написания. Например, почему Переславль-Залесский пишется через дефис, а Ростов Великий — раздельно? Разбираем сложные орфографические случаи и объясняем, с чем может быть связана разница.
...Русская топонимика может показаться запутанной и нелогичной...
...Раздельное написание топонимов Географические названия...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
Приятель брата — Митя или Дима? А новая коллега — Женя или Евгения? Анна Ивановна считает себя начальником или начальницей? Как описать соседа: он глухой или с нарушениями слуха? Во многих ситуациях нам приходится делать этот непростой выбор. На что лучше ориентироваться: на мнение того, о ком речь, на правила языка или на собственное удобство? Грамота расспросила об этом популяризатора лингвистики, кандидата филологических наук Александра Пиперски.
...Приятель брата — Митя или Дима? А новая...
...Выбор имени: родители, святцы и другие алгоритмы...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Грамота: Почему было решено выделить произведения русских...
В последние годы государство уделяет большое внимание языковой политике и законодательству о языке. Были приняты поправки к закону «О государственном языке», идет работа над созданием Национального словарного фонда, утверждена Концепция государственной языковой политики, есть программы сохранения языкового разнообразия России. Какие проблемы сейчас стоят перед обществом, если говорить о русском языке? Каким образом можно было бы эффективно повысить речевую культуру жителей страны? Об этом нам рассказал руководитель Грамоты, член Совета при президенте РФ по русскому языку Константин Деревянко.
...В последние годы государство уделяет большое внимание...
...Грамота: Вы уже много лет занимаетесь издательскими...
Новая языковая модель на основе искусственного интеллекта DolphinGemma может приблизить ученых к пониманию коммуникации дельфинов. О проекте сообщает блог компании Google, которая реализует его совместно с исследователями из Технологического института Джорджии (США) и организации Wild Dolphin Project (WDP). DolphinGemma обучена на обширной базе записей звуков, которые издают атлантические пятнистые дельфины. Основная цель проекта — не только распознавать щелчки, свисты и ...
...Новая языковая модель на основе искусственного интеллекта...
Выпуск посвящен семантике русских слов и отражает результаты работы Лаборатории машинного перевода МГПИИЯ в первой половине 1960-х годов. В нем опубликованы работы Александра Жолковского, Нины Леонтьевой, Виктора Розенцвейга, Юрия Щеглова и других исследователей. Сборник на момент написания был ценным вкладом в исследование семантики русского языка и предложил основу для разработки семантических алгоритмов и формальных методов описания значений слов.
...Выпуск посвящен семантике русских слов и отражает результаты...
...Владение смыслом слов проявляется у говорящего в способности...
Кажется, что машины начали вести с нами диалог совсем недавно. На самом деле их история насчитывает несколько десятилетий. Сам термин «чат-бот» появился в 1994 году — его предложил компьютерный инженер Майкл Молдин. А идея программного обеспечения, способного взаимодействовать с людьми на естественном языке, родилась гораздо раньше. Грамота рассказывает о том, как разработчики в разные годы пытались научить бездушные машины общаться по-человечески.
...Кажется, что машины начали вести с нами диалог...
...Работа по сценарию Разработчики будущих чат-ботов...