Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Книга «Табу слов у народов Восточной Европы и Северной Азии» в двух частях — фундаментальный труд по этнографии и лингвистике, который не переиздавался с 1929 года. Этнограф и фольклорист Дмитрий Зеленин подробно описал языковые табу у разных народов Евразии в сопоставлении с другими регионами мира.
...Книга «Табу слов у народов Восточной Европы...
...Древние считали, что «подлинные» названия...
Прежде всего приношу свои извинения за то, что вынесла в заголовок слово, которое тонкому слуху просвещенного читателя может показаться оскорбительным. На самом деле никакого отношения к некоему естественному физиологическому процессу эта лексическая единица не имеет, а вот к теме «Язык и Рунет» тяготеет самым наинепосредственнейшим образом. Ибо данное слово в лексиконе юного поколения, погрузившегося в дебри Интернета, означает всего лишь персональный компьютер.
...Прежде всего приношу свои извинения за то, что вынесла...
...Общеизвестно, что на английском языке personal computer...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Любимые всеми книги и фильмы часто рассказывают захватывающие и необычные истории. Но и таким форматам, как рекламный ролик или пост в блоге, чтобы попасть в топы просмотров, необходимо чем-то зацепить пользователя. Сегодня авторы нередко обращаются к генеративным языковым моделям в поисках вдохновения. Но есть ли в этом польза? Может быть, правы скептики, и их массовое применение убьет творчество? Исследователи Анил Доши из Лондонского ...
...Любимые всеми книги и фильмы часто рассказывают...
Вопрос о возможности заменить отчество на матчество в официальных документах вызывает сегодня бурные дискуссии, хотя это явление не так чуждо русской культуре, как может показаться.
...Вопрос о возможности заменить отчество на матчество...
...Древнерусские матери Для нас привычно, что у человека...
Литература, как и любая сложная система, развивается и эволюционирует. Какие-то произведения остаются в центре внимания читателей на десятки и даже сотни лет, другие забываются сразу после издания. Так работает «литературная эволюция», модель которой начинал разрабатывать русский филолог Юрий Тынянов. Применима ли эта концепция к отдельным частям произведения — например, к диалогу? Об исследованиях на эту тему пишет «Системный Блокъ».
...Литература, как и любая сложная система, развивается...
...Исследователь Института Макса Планка Олег Собчук в&...
На первом саммите Россия — Ассоциация государств Юго-Восточной Азии (АСЕАН), который прошел на полях Всемирного фестиваля молодежи в Сочи, было предложено открыть центры изучения русского языка в столицах азиатских государств. Такую идею высказали Филиппины, ее поддержали Вьетнам, Малайзия, Сингапур и Мьянма. По словам представителя Филиппин, платформы для изучения русского языка могут быть организованы на базе МГИМО или иных лингвистических университетов ...
...На первом саммите Россия — Ассоциация государств...
Более 780 тыс. человек приняли участие в просветительской акции «Тотальный диктант», которая состоялась 9 апреля. В режиме онлайн диктант прошел в 108 странах, очно его написали в более чем 500 населенных пунктах в РФ и в 31 стране. Об этом в понедельник заявила директор фонда «Тотальный диктант» Ольга Ребковец на пресс-конференции в ТАСС.
...Более 780 тыс. человек приняли участие в просветительской...