Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Уже сейчас писатели издают книги, которые написаны ими в соавторстве с нейросетями. Спецпроект «Писатели vs Нейросети», созданный изданиями «Системный Блокъ» и «Подтекст», анализирует, какие этапы создания художественного текста может упростить нейросеть и насколько полезны языковые модели.
...Уже сейчас писатели издают книги, которые написаны...
...Кто лучше напишет рассказ? В ходе эксперимента писателю...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Аналитический центр ВЦИОМ изучил, как россияне относятся к обсценной лексике. Оказалось, что семь из десяти опрошенных хотя бы иногда используют нецензурные ругательства. Доля тех, кто матерится ежедневно, за последние 17 лет выросла значительно — с 20% до 34%. Мужчины и молодежь (зумеры и младшие миллениалы) являются основными «источниками» мата: почти половина мужчин и две трети зумеров используют нецензурную лексику ежедневно. А вот географических различий в ...
...Аналитический центр ВЦИОМ изучил, как россияне относятся...
В народной культуре, придающей большое значение снам, образы, которые человек видит во сне, получают то или иное толкование. Лингвистическая задача, которую придумал ульяновский фольклорист Е. В. Сафронов, строится вокруг тех принципов, по которым мы обычно толкуем сновидения. Задача была опубликована в журнале «Наука и жизнь» .
...В народной культуре, придающей большое значение снам...
...Толкования сновидений, как правило, не произвольны,...
Когда ребенок учится читать, родители обычно покупают ему азбуку. Но есть другой способ познакомить его с буквами. В книжках, которые мы выбрали для этого обзора, буквы и другие графические знаки действуют как полноценные персонажи. Эти истории учат более глубокому пониманию роли текста в окружающем человека пространстве. Ведь даже в одной точке может содержаться целая вселенная.
...Когда ребенок учится читать, родители обычно покупают...
...1. Ирина Токмакова. Аля, Кляксич и буква А &...
Учитель географии Грэм Сениор из города Ковентри (Великобритания, регион Западный Мидленд), работая в саду, случайно откопал древний артефакт, сообщает The Guardian. Небольшой прямоугольный камень с насечками британец первоначально принял за древний календарь. Однако специалисты опознали в насечках огам — старинный кельтский алфавит. Огамическое письмо было распространено на территории Ирландии и Великобритании в IV–VI веках н. э.
...Учитель географии Грэм Сениор из города Ковентри (Великобритания...
Всероссийский этнодиктант — это просветительская акция, организованная Ассоциацией коренных малочисленных народов Севера, Сибири и Дальнего Востока РФ (Ассоциация КМНСС и ДВ РФ). Он приурочен к Международному дню родного языка, который отмечается 21 февраля. В этом году тема диктанта — празднование 80-летия победы в Великой Отечественной войне. Диктант пишется на русском языке, а также на государственных языках и языках коренных народов России, включая языки народов ...
...Всероссийский этнодиктант — это просветительская...
Зоны мозга, связанные с обработкой речи, почти не «подают голос», когда мы читаем грамматически простые и понятные предложения. Однако их активность возрастает, когда мы продираемся сквозь сложный текст. Но насколько сложным он должен быть? Исследователи из Массачусетского технологического института решили проверить, как речевые зоны реагируют на фразы разной сложности. Для начала они выбрали 1000 предложений из художественной литературы, расшифровок устной речи, текстов ...
...Зоны мозга, связанные с обработкой речи, почти не &...