Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Если повторить одно и то же слово много раз, в какой-то момент оно покажется бессмысленным набором звуков. Многие проверяли на себе это забавное явление хотя бы раз в жизни. Но, как выяснилось, им интересуются и исследователи. Авторы статьи, опубликованной в журнале Memory, провели эксперимент с целью понять, легко ли вызвать это ощущение целенаправленно. В ходе эксперимента 94 студента должны были много раз подряд записывать одно и то же слово. Они проделывали это с 12 словами (например, со ...
...Если повторить одно и то же слово много раз, в какой-то...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Коммуникативный запрет — это не «стоп-лист», а добровольный отказ от той или иной модели речевого поведения. Таково видение обсуждаемой проблемы Владимира Ильича Карасика, доктора филологических наук, профессора кафедры общего и русского языкознания Института Пушкина. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...Коммуникативный запрет — это не «стоп-лист...
...Один из известнейших дискурсологов Владимир Карасик...
Российская государственная детская библиотека совместно с Литературным институтом им. А. М. Горького и Государственным музеем А. С. Пушкина при поддержке Министерства культуры Российской Федерации проводят Всероссийский конкурс «Символы России. Русский язык: история письменности». Участникам конкурса предлагают придумать интересные вопросы по истории русского языка и орфографии, письменности и печатного дела на Руси. В конкурсе могут принять участие дети и подростки двух ...
...Российская государственная детская библиотека совместно...
В конце декабря 2023 года министерство образования Великобритании ввело британский жестовый язык в программу для получения общего сертификата среднего образования (GCSE). Это означает, что любой учащийся 14–16 лет (на этот возраст рассчитана программа) сможет освоить жестовый язык как предмет по выбору. Такое решение власти страны приняли отчасти благодаря усилиям семнадцатилетнего Дэниела Джиллингса. Он последовательно выступал за включение жестового языка в школьный ...
...В конце декабря 2023 года министерство образования...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Филолог Юлия Сафонова рассказывает в журнале «Наука и жизнь» о забытых русских словах.
...Филолог Юлия Сафонова рассказывает в журнале &...
...В книгах детского писателя Николая Носова были герои...
6 июня в Псковской области на территории музея-заповедника «Михайловское» начнется четырехдневный фестиваль «Дни пушкинской поэзии и русской культуры». Для участников приготовлена насыщенная программа: выставка «Эмоции природы, природа эмоций. Пушкинский литературный ландшафт»; арт-прогулка, посвященная отражениям пушкинских мест и пушкинских стихов в творчестве современных художников; опера «Евгений Онегин» в
...6 июня в Псковской области на территории музея-заповедника...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...