Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Ежегодная лекция о новых находках состоялась 20 ноября 2023 года. Академик РАН Алексей Гиппиус, продолжая традицию, начатую его учителем, Андреем Анатольевичем Зализняком, рассказал о результатах раскопок прошедшего сезона: о пятнадцати новгородских грамотах и четырех грамотах из Старой Руссы. Трансляцию можно посмотреть на канале Института славяноведения РАН.
...Ежегодная лекция о новых находках состоялась 20 ноября...
...Самая древняя из найденных в 2023 году новгородских...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Проект «Слово Толстого» — цифровой...
Прежде всего приношу свои извинения за то, что вынесла в заголовок слово, которое тонкому слуху просвещенного читателя может показаться оскорбительным. На самом деле никакого отношения к некоему естественному физиологическому процессу эта лексическая единица не имеет, а вот к теме «Язык и Рунет» тяготеет самым наинепосредственнейшим образом. Ибо данное слово в лексиконе юного поколения, погрузившегося в дебри Интернета, означает всего лишь персональный компьютер.
...Прежде всего приношу свои извинения за то, что вынесла...
...Общеизвестно, что на английском языке personal computer...
Предлагаем вниманию читателей портала статью Павла Яковлевича Черных, опубликованную в журнале «Русский язык в школе» (№ 3, 1949). Правильно ли мы читаем и, главное, понимаем программное стихотворение А. С. Пушкина? Как в черновиках поэта выглядели знакомые нам со школьной скамьи строки? Об этом идет речь в статье.
...Предлагаем вниманию читателей портала статью Павла...
...Предисловие «Грамоты.ру» Павел Яковлевич...
О реформах русского языка до революции и в советское время и о том, почему необходим общеобязательный свод правил, рассказывает доктор филологических наук Владимир Лопатин.
...О реформах русского языка до революции и в советское...
...Вплоть до конца XIX века никаких систематизированных...
Корнский (Kernowek, англ. Cornish) — потомок древнего бриттского языка, на котором говорило коренное население острова Корнуэлл до прихода англосаксов. С V века число носителей языка постепенно сокращалось, а последние корноговорящие жители (для кого этот язык был первым и главным) умерли в конце XVIII века, хотя, по некоторым данным, язык в какой-то степени сохранялся и в течение XIX века. В 2009 году ООН признала язык ...
...Корнский (Kernowek, англ. Cornish) — потомок...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
В новом выпуске — разговорная речь в качестве ресурса для коммерческих номинаций городских объектов, мем «суету навести охота», знаменитая «глокая куздра» лингвиста Льва Щербы и другие темы. Рассмотрим подробнее три статьи номера.
...В новом выпуске — разговорная речь в ...
...Разговорная речь как ресурс для коммерческих номинаций...