В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Международная торговая компания Alibaba International Digital Commerce (AIDC) Group, известная как Alibaba, анонсировала запуск новой большой языковой модели Macro MT, разработанной специально для переводов в сфере международной торговли. Решение создать такой сервис в компании приняли после того, как обнаружили, что существующие инструменты перевода не учитывают в полной мере культурные особенности текстов. Модель будет встроена в системы управления ...
...Международная торговая компания Alibaba International...
Все мы знаем писателей Салтыкова-Щедрина и Мамина-Сибиряка, композитора Римского-Корсакова и гоголевского персонажа Сквозника-Дмухановского. В наши дни подобные двойные фамилии довольно редки, но всё еще встречаются. Каково происхождение этих фамилий и что важно знать об их склонении?
...Все мы знаем писателей Салтыкова-Щедрина и Мамина-Сибиряка...
...Ветви рода Самые древние среди русских двойных фамилий...
Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Недавнее исследование, проведенное учеными из ...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...В последнее время искусственный интеллект далеко...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...
Поначалу слово из английского, французского или чешского языка кажется знакомым... и тут выясняется, что у него совершенно другое значение — иногда прямо противоположное. Любой, кто имеет дело с иностранными языками, хоть раз попадал впросак из-за «ложных друзей переводчика». Какие языковые процессы приводят к появлению таких слов? Можно ли их распознать и уберечься от ошибок?
...Поначалу слово из английского, французского или чешского...
...Что это за друзья такие Впервые эту метафору употребили...
Как в точности соотносятся церковнославянский, старославянский и древнерусский языки? На это вопрос даже многие выпускники филологических факультетов не могут дать внятный ответ. При этом если древнерусский и старославянский остались в далеком прошлом, церковнославянский жив и сегодня, хотя и для ограниченного круга людей. Как сложилась его судьба и чем он интересен с лингвистической точки зрения? Об этом Грамота поговорила с ведущим научным сотрудником Института русского языка им. В. В. Виноградова РАН, руководителем научного центра по изучению церковнославянского языка и проекта создания Большого словаря церковнославянского языка Нового времени Александром Геннадьевичем Кравецким.
...Как в точности соотносятся церковнославянский, старославянский...
...Грамота: В чем все-таки разница между древнерусским...
Короткое слово «пока» настолько нам привычно, что без него не обходится ни одно повседневное расставание близких или хорошо знакомых друг с другом людей. Но так было не всегда. Историю превращения этого маленького слова из наречия в способ неформального прощания рассказывает лингвист Ирина Фуфаева.
...Короткое слово «пока» настолько нам привычно...
...Слово пока играет в русском языке разные роли. Оно...
Новый номер доступен на сайте журнала. Напомним, что на сайте выложены в открытый доступ все номера журнала за 1967–2023 годы.
...Новый номер доступен на сайте журнала. Напомним...
...В новом номере: о моде на слово история и связи...