В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Новое исследование, опубликованное в журнале Frontiers in Psychology, выявило серьезные ограничения современных языковых моделей в понимании метафорического языка. Специалисты протестировали ChatGPT-4 на анализе четырех ключевых политических речей Дональда Трампа, произнесенных с середины 2024 по начало 2025 года, включая выступления после покушения и по случаю победы на выборах, инаугурационную речь и обращения к Конгрессу. Модели ...
...Новое исследование, опубликованное в журнале Frontiers...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Среди традиционно спорных вопросов перевода — вопрос о том, допустимо ли вторгаться в структуру фраз оригинала. Искусство в этом, как и в других вопросах, вроде соотношения точности и свободы в переводе, состоит в том, чтобы умело лавировать между двумя крайностями. Как именно происходит непростой выбор формы и какими соображениями руководствуются переводчики, рассказывает переводчик с французского Наталья Мавлевич.
...Среди традиционно спорных вопросов перевода &mdash...
...Надо ли подстригать фразы оригинала, как деревья в&...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
5 апреля стали известны имена победителей и призеров Всероссийской олимпиады «Символы России. Русский язык: история письменности». Их список опубликован на сайте Российской государственной детской библиотеки, которая выступает соучредителем олимпиады. Участники олимпиады соревновались в двух возрастных категориях, 10–12 лет и 13–16 лет. На втором, финальном этапе старшим предлагалось ответить, среди прочих, на такие вопросы. К
...5 апреля стали известны имена победителей и ...
Программисты из Югры работают над нейросетью, аналогичной ChatGPT, которая могла бы помочь чиновникам в написании законопроектов. Об этом в интервью газете «Вестник Сургутского района» рассказал директор департамента информационных технологий и цифрового развития, заместитель губернатора ХМАО Павел Ципорин. Разработкой занимается Югорский НИИ информационных технологий. «У нас возникла гипотеза, что мы можем обучить нейросетевую модель на наших ...
...Программисты из Югры работают над нейросетью, аналогичной...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Международная торговая компания Alibaba International Digital Commerce (AIDC) Group, известная как Alibaba, анонсировала запуск новой большой языковой модели Macro MT, разработанной специально для переводов в сфере международной торговли. Решение создать такой сервис в компании приняли после того, как обнаружили, что существующие инструменты перевода не учитывают в полной мере культурные особенности текстов. Модель будет встроена в системы управления ...
...Международная торговая компания Alibaba International...
В народной культуре, придающей большое значение снам, образы, которые человек видит во сне, получают то или иное толкование. Лингвистическая задача, которую придумал ульяновский фольклорист Е. В. Сафронов, строится вокруг тех принципов, по которым мы обычно толкуем сновидения. Задача была опубликована в журнале «Наука и жизнь» .
...В народной культуре, придающей большое значение снам...
...Толкования сновидений, как правило, не произвольны,...