Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Новое исследование, опубликованное в журнале Frontiers in Psychology, выявило серьезные ограничения современных языковых моделей в понимании метафорического языка. Специалисты протестировали ChatGPT-4 на анализе четырех ключевых политических речей Дональда Трампа, произнесенных с середины 2024 по начало 2025 года, включая выступления после покушения и по случаю победы на выборах, инаугурационную речь и обращения к Конгрессу. Модели ...
...Новое исследование, опубликованное в журнале Frontiers...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Среди традиционно спорных вопросов перевода — вопрос о том, допустимо ли вторгаться в структуру фраз оригинала. Искусство в этом, как и в других вопросах, вроде соотношения точности и свободы в переводе, состоит в том, чтобы умело лавировать между двумя крайностями. Как именно происходит непростой выбор формы и какими соображениями руководствуются переводчики, рассказывает переводчик с французского Наталья Мавлевич.
...Среди традиционно спорных вопросов перевода &mdash...
...Надо ли подстригать фразы оригинала, как деревья в&...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
5 апреля стали известны имена победителей и призеров Всероссийской олимпиады «Символы России. Русский язык: история письменности». Их список опубликован на сайте Российской государственной детской библиотеки, которая выступает соучредителем олимпиады. Участники олимпиады соревновались в двух возрастных категориях, 10–12 лет и 13–16 лет. На втором, финальном этапе старшим предлагалось ответить, среди прочих, на такие вопросы. К
...5 апреля стали известны имена победителей и ...
Программисты из Югры работают над нейросетью, аналогичной ChatGPT, которая могла бы помочь чиновникам в написании законопроектов. Об этом в интервью газете «Вестник Сургутского района» рассказал директор департамента информационных технологий и цифрового развития, заместитель губернатора ХМАО Павел Ципорин. Разработкой занимается Югорский НИИ информационных технологий. «У нас возникла гипотеза, что мы можем обучить нейросетевую модель на наших ...
...Программисты из Югры работают над нейросетью, аналогичной...
Когда-то мы смеялись над корявостью и глупостью первых языковых моделей. Сегодня чат-боты пишут за людей деловые письма и посты, сочиняют рассказы, ведут задушевные беседы и приводят аргументы в спорах. Есть ли что-то, чем речь машины в корне отличается от человеческой? И может ли эксперт — или даже другая машина — обнаружить эту разницу?
...Когда-то мы смеялись над корявостью и глупостью первых...
...Гладко, но безжизненно Машина пишет текст не ...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...