Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Недавно принятая в России Концепция государственной языковой политики призывает к защите русского языка от иностранных заимствований. До этого, в феврале 2023 года, были приняты поправки в закон «О государственном языке РФ», которые ограничивают использование англицизмов в рекламе. Россия — не единственная страна, чье правительство обеспокоено защитой своего языка от иностранного влияния. Такую же политику проводит и канадская ...
...Канада может попасть под санкции США из-за дискриминации...
...Недавно принятая в России Концепция государственной...
В 1780-х годах императрица Екатерина II поручила ученому-энциклопедисту, путешественнику, академику Берлинской и Санкт-Петербургской академий наук Петру Симону Палласу (1741–1811) составить сравнительный словарь языков народов России и всего мира. Первое издание (в двух частях, которые вышли в 1787 и 1789 годах) включало 273 понятия, которые были представлены (с лакунами) на 149 языках Азии и 51 языке Европы.
...«Сравнительный словарь всех языков и наречий» Палласа...
...В 1780-х годах императрица Екатерина ...
Во время извержения Везувия в 79 году н. э. сотни свитков папируса в библиотеке роскошной виллы недалеко от Геркуланума (так называемой Виллы Папирусов) были погребены под слоем пепла и пемзы. Прежде исследователи полагали, что содержание наиболее пострадавших свитков утрачено навсегда. Но недавно с помощью цифровой реставрации удалось прочесть надпись на одном из них. Команда специалистов в области компьютерных наук из Университета Кентукки в марте 2023 года запустила конкурс Vesuvius ...
...Исследователи расшифровали древнюю надпись с помощью...
...Во время извержения Везувия в 79 году н. э. сотни свитков...
Ответственный редактор монографии — академик Николай Николаевич Казанский, специалист по классической филологии и индоевропеистике. Книга рассчитана на широкий круг читателей, которые интересуются российской наукой и ее историей.
...Ответственный редактор монографии — академик...
...Вышла коллективная монография о научных школах петербургского...
...Институт лингвистических исследований имеет богатую...
Разговор в программе «Наблюдатель» начинается с главного вопроса, который задает ведущая Фекла Толстая: есть ли вообще в России диалекты в XXI веке? Что от них осталось? Лингвисты Игорь Исаев (Институт языкознания РАН), Валерий Ефремов (РГПУ им. А. И. Герцена), Александра Ольховская (Институт Пушкина) и Нелли Красовская (ТГПУ им. Л. Н. Толстого) отвечают на этот вопрос по-разному, но очень эмоционально.
...Разговор в программе «Наблюдатель»...
...Стыдно ли говорить на диалекте?...
...Когда мы говорим о диалектах, мы отмечаем в ...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Нейросеть выучилась понимать язык без использования...
...Большие языковые модели — нейросети, способные...
В ЕГЭ по русскому языку станет допустимым прибегать к интерпретации сюжета мультфильма, аниме, манги, комикса, графического романа или компьютерной игры. Об этом говорится в опубликованном на сайте Федерального института педагогических измерений (ФИПИ) «Навигаторе самостоятельной подготовки к экзамену». Использовать подобные аргументы можно будет в задании 27, в котором требуется написать сочинение по прочитанному тексту. В
...В ЕГЭ по русскому языку разрешили ссылаться на сюжеты...
...В ЕГЭ по русскому языку станет допустимым прибегать...
Корнский (Kernowek, англ. Cornish) — потомок древнего бриттского языка, на котором говорило коренное население острова Корнуэлл до прихода англосаксов. С V века число носителей языка постепенно сокращалось, а последние корноговорящие жители (для кого этот язык был первым и главным) умерли в конце XVIII века, хотя, по некоторым данным, язык в какой-то степени сохранялся и в течение XIX века. В 2009 году ООН признала язык ...
...Поп-культура и пандемия «оживили» считавшийся мертвым...
...Корнский (Kernowek, англ. Cornish) — потомок...
Нейросети уже неплохо справляются с анализом и порождением текстов, они умеют многое из того, что раньше делали только люди. Какие возможности это дает? Участники круглого стола «Ай да AI. Нейросети и создание текстов: проблемы и перспективы генеративных моделей» обсудили, чем ИИ может помочь в научной работе и какие навыки понадобятся людям в цифровую эпоху. Грамота записала самое главное.
...Нейросети уже неплохо справляются с анализом и...
...Что нейросети умеют делать с текстами и чем предстоит...
...В дискуссии на Костомаровском форуме участвовали руководитель...