Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
С 13 октября по 10 ноября 2022 года более 500 преподавателей русского языка из почти 70 стран мира примут участие в дистанционных методических мероприятиях, которые проведут для них российские коллеги: преподаватели известных вузов и успешных языковых школ, авторы и издатели популярных учебных пособий по русскому языку как иностранному (РКИ), опытные специалисты в сфере дистанционного обучения. Методические мероприятия организованы при поддержке Федерального агентства по делам Содружества ...
...С 13 октября по 10 ноября 2022 года более 500 преподавателей...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Кажется, что машины начали вести с нами диалог совсем недавно. На самом деле их история насчитывает несколько десятилетий. Сам термин «чат-бот» появился в 1994 году — его предложил компьютерный инженер Майкл Молдин. А идея программного обеспечения, способного взаимодействовать с людьми на естественном языке, родилась гораздо раньше. Грамота рассказывает о том, как разработчики в разные годы пытались научить бездушные машины общаться по-человечески.
...Кажется, что машины начали вести с нами диалог...
...Работа по сценарию Разработчики будущих чат-ботов...
В последнее время устаревшая церковнославянская и конфессиональная лексика активно используются современными массмедиа. Рассчитанные на массового читателя и слушателя, современные массово-коммуникативные тексты, воспроизводя стандартные языковые модели, обращаются к устаревшей лексике для большей эмоциональности, экспрессивности.
...В последнее время устаревшая церковнославянская и конфессиональная...
...Исследователь проблем современного русского языка Е...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Россия не первая страна, которая сталкивается с задачей адаптации мигрантов. В декабре 2024 года Госдума приняла в трех чтениях закон, запрещающий зачислять в российские школы детей-неграждан, которые не владеют русским языком. Чему учит мировой опыт обучения иноязычных детей и что говорит об этом международное право? Попробуем посмотреть на общую картину.
...Россия не первая страна, которая сталкивается...
...Что говорят международные конвенции Согласно международным...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...