Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Формы организации текстового материала в Интернете весьма разнообразны. Не претендуя на формирование понятий, связанных с Интернетом, попробуем разобраться в семантике тех слов, которые, используя Интернет, мы уже часто употребляем, хотя они еще не получили своего места в лексической системе русского языка.
...Формы организации текстового материала в Интернете...
...Условно виртуальные тексты по способу образования и...
Редакционная политика — удобный инструмент, который помогает создавать тексты не только средствам массовой информации, но и бизнес-изданиям, государственным порталам, онлайн-проектам, блогерам, копирайтерам и маркетологам. Какую пользу она может принести и что надо учесть при ее разработке? Опишем в общих чертах, как обычно устроена редполитика, чтобы каждая команда, работающая с текстами, могла затем приспособить ее для своих нужд.
...Редакционная политика — удобный инструмент...
...Что такое редполитика Редакционная политика &mdash...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
28 мая в России в четвертый раз отмечали Международный день ясного языка. Этот день, в числе прочего, — возможность рассказать об особых потребностях некоторых групп людей в области чтения и понимания информации. Именно для этого существует адаптированный вариант языка, называемый ясным. В 2024 году Дом культуры «ГЭС-2» при поддержке благотворительных фондов «Даунсайд Ап» («Синдром любви») и «Лучшие ...
...28 мая в России в четвертый раз отмечали...
Число текстов, сгенерированных искусственным интеллектом, в последние годы растет в геометрической прогрессии. И качество таких текстов постоянно улучшается. А это значит, что определить, к примеру, реальное авторство учебной работы будет все труднее. Ведь текст, порожденный нейросетями, выглядит уникальным, его не распознаёт проверка инструментами вроде «Антиплагиата». Однако справиться с этой задачей обещают исследователи Высшей школы экономики.
...Число текстов, сгенерированных искусственным интеллектом...
Ведущий канала «Основа» Борис Веденский обсудил с историком-медиевистом, переводчиком, доктором исторических наук Олегом Воскобойниковым отличия письменной культуры Руси от стран Западной Европы, процесс переписывания рукописей и издание древних текстов, а также выяснил, что пили в Средние века и были ли на Руси ведьмы.
...Ведущий канала «Основа» Борис Веденский...
...Монгольское нашествие сильно ударило по всем сторонам...
В рамках исследования авторы работы (сотрудники двух факультетов МГУ — иностранных языков и регионоведения, вычислительной математики и кибернетики) протестировали способность пяти ведущих больших языковых моделей — ChatGPT-4, Gemini-pro-1.5, Claude 3 Opus, Llama3-70b и Microsoft Phi-3 — выполнять письменные задания из популярных учебников, выпущенных издательствами Oxford University Press и Pearson Education. Моделям требовалось выполнить следующие ...
...В рамках исследования авторы работы (сотрудники...
Премию имени М. В. Ломоносова I степени за научные работы Ученый совет МГУ присудил Наталье Лукашевич — доктору технических наук, ведущему научному сотруднику НИВЦ МГУ и профессору кафедры теоретической и прикладной лингвистики филологического факультета. Наталья Лукашевич создала цикл статей о методах автоматического анализа текстов на русском языке (включая их классификацию, извлечение информации, анализ тональности, семантический анализ и другие виды аналитической обработки ...
...Премию имени М. В. Ломоносова I степени за научные...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...