Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Какие школьные дисциплины пригодились россиянам больше всего в жизни и чем, по их мнению, следовало бы дополнить школьную программу? Исследование на эту тему провели сервисы «Работа.ру» и «Деловая среда». Больше всего опрошенных (70%) назвали самым полезным предметом русский язык. 27% отдали свои голоса за иностранный язык, а 25% — за литературу. Авторы исследования также выяснили, чего россиянам не хватает в школьной программе. Третьим по популярности стал запрос ...
...Какие школьные дисциплины пригодились россиянам больше...
Как русская языковая картина мира соотносится с мировосприятием носителей других языков и культур? Какие языковые примеры позволяют нам сравнивать картины мира? Как были переосмыслены некоторые заимствованные в русский язык слова? Об этом — лекция доктора филологических наук, члена-корреспондента РАН Алексея Дмитриевича Шмелева.
...Как русская языковая картина мира соотносится с ...
...Для нас привычно связывать мыслительную деятельность...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Этот вопрос мы задали трем лингвистам, которые не только исследуют русский язык научными методами, но и общаются со студентами и поэтому имеют непосредственное представление о том, как говорит сегодня молодежь. Во время дискуссии «В поисках грамотности», которая состоялась на 37-й Московской международной книжной ярмарке в начале сентября, мы услышали опровержение многих стереотипов.
...Этот вопрос мы задали трем лингвистам, которые не только...
...Недавно в одном научном журнале нам встретились...
«Надо обсудить это с моим GPT» — эта фраза уже не звучит как шутка из стендап-номера о новой технологической реальности. Искусственный интеллект стал для многих привычным собеседником. В этой статье мы попробовали разобраться, чем стиль общения чат-ботов так пленяет многих людей и как нечеловеческие собеседники уже вписываются (и еще могут вписаться) в нашу жизнь.
...«Надо обсудить это с моим GPT» —...
...От утилитарности к человечности Беседы с искусственным...
В подлинности «Слова» чаще сомневаются историки и литературоведы, а не лингвисты. О том, какие лингвистические аргументы позволяют говорить о подлинности «Слова», филолог Елена Галинская пишет в статье для журнала «Наука и жизнь».
...В подлинности «Слова» чаще сомневаются...
...Уже два столетия не утихают споры об одном из главных...
Разработка стартапа Cybernet AI стала первым масштабным решением в области автоматического распознавания речи (ASR), созданным с нуля специально для тюркской языковой группы, а не адаптированным из англоязычных моделей. Большинство систем, используемых в регионе, до недавнего времени базировались на архитектурах, изначально обученных на английском языке. Такие универсальные модели плохо справлялись с фонетикой, особенностями интонации и
...Разработка стартапа Cybernet AI стала первым масштабным...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...