Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Исследование: внутренний язык больших языковых моделей...
...Большинство нейросетевых языковых моделей обучаются...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Новый подход поможет людям более успешно общаться с...
...Большие языковые модели — подобные тем,...
Нам трудно себе это представить, но зимние праздники еще двести лет назад выглядели совсем не так, как сегодня. И не только потому, что главным было Рождество, но и потому, что никаких новогодних и рождественских елок во времена Пушкина еще не было. Мы решили разобраться, как появилось в России главное новогоднее слово и какими еще словами сопровождается встреча Нового года.
...Нам трудно себе это представить, но зимние праздники...
...Самое новогоднее слово...
...Святки, Рождество, Новый год Впервые елку на рождественские...
Литература, как и любая сложная система, развивается и эволюционирует. Какие-то произведения остаются в центре внимания читателей на десятки и даже сотни лет, другие забываются сразу после издания. Так работает «литературная эволюция», модель которой начинал разрабатывать русский филолог Юрий Тынянов. Применима ли эта концепция к отдельным частям произведения — например, к диалогу? Об исследованиях на эту тему пишет «Системный Блокъ».
...Литература, как и любая сложная система, развивается...
...«Заговори, чтобы я тебя увидел»...
...Исследователь Института Макса Планка Олег Собчук в&...
Появление языка — один из поворотных моментов эволюции, выделивший человека среди других видов. Но можно ли считать язык исключительно нашим ноу-хау? Последние научные данные говорят о том, что элементы довольно сложных систем коммуникации есть и у других животных. Например, недавно у кашалотов выделили нечто похожее на алфавит. И вот теперь на очереди — слоны. Ранее было известно, что бутылконосые дельфины способны привлекать внимание конкретного ...
...У слонов обнаружили способность называть друг друга...
...Появление языка — один из поворотных моментов...
5 апреля стали известны имена победителей и призеров Всероссийской олимпиады «Символы России. Русский язык: история письменности». Их список опубликован на сайте Российской государственной детской библиотеки, которая выступает соучредителем олимпиады. Участники олимпиады соревновались в двух возрастных категориях, 10–12 лет и 13–16 лет. На втором, финальном этапе старшим предлагалось ответить, среди прочих, на такие вопросы. К
...Объявлены победители и призеры Всероссийской олимпиады...
...5 апреля стали известны имена победителей и ...
Нейросети уже неплохо справляются с анализом и порождением текстов, они умеют многое из того, что раньше делали только люди. Какие возможности это дает? Участники круглого стола «Ай да AI. Нейросети и создание текстов: проблемы и перспективы генеративных моделей» обсудили, чем ИИ может помочь в научной работе и какие навыки понадобятся людям в цифровую эпоху. Грамота записала самое главное.
...Нейросети уже неплохо справляются с анализом и...
...Что нейросети умеют делать с текстами и чем предстоит...
...В дискуссии на Костомаровском форуме участвовали руководитель...
В 1780-х годах императрица Екатерина II поручила ученому-энциклопедисту, путешественнику, академику Берлинской и Санкт-Петербургской академий наук Петру Симону Палласу (1741–1811) составить сравнительный словарь языков народов России и всего мира. Первое издание (в двух частях, которые вышли в 1787 и 1789 годах) включало 273 понятия, которые были представлены (с лакунами) на 149 языках Азии и 51 языке Европы.
...«Сравнительный словарь всех языков и наречий» Палласа...
...В 1780-х годах императрица Екатерина ...
В предыдущих сезонах ведущие, научный руководитель Грамоты Владимир Пахомов и журналист Александр Садиков, говорили о том, как был устроен русский язык в прошлом, начиная с XVI века. В осенне-зимнем сезоне 2023 года они обсудят будущее языка: каким он будет через пятьдесят или сто лет, как на него влияют новые технологии и какие языковые процессы можно наблюдать в русском языке уже сейчас.
...В предыдущих сезонах ведущие, научный руководитель...
...Вышел первый выпуск нового сезона подкаста «Розенталь...
...Язык как система поддается прогнозированию. В чем-то...