Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...В последнее время искусственный интеллект далеко...
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Грамота: Все, кто работает с языком как исследователи...
Ведущая рубрики «Русский устный», член редакционного совета портала «Грамота.ру» Юлия Сафонова напоминает об авторе текста эпитафии на Пискаревском кладбище, поэтессе Ольге Берггольц, а также рассказывает о других ленинградских деятелях культуры.
...Ведущая рубрики «Русский устный», член редакционного...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Происхождение индоевропейских языков остается дискуссионным вопросом уже больше двухсот лет. К настоящему времени сложились две основные гипотезы: «степная», которая ищет истоки языковой семьи в понтийско-каспийской степи около шести тысяч лет назад, и «земледельческая», предполагающая более древнее происхождение, связанное с ранним земледелием около девяти тысяч лет назад. Новый вклад в эту дискуссию внесли исследователи из Отдела лингвистической и культурной эволюции ...
...Происхождение индоевропейских языков остается дискуссионным...
Литература, как и любая сложная система, развивается и эволюционирует. Какие-то произведения остаются в центре внимания читателей на десятки и даже сотни лет, другие забываются сразу после издания. Так работает «литературная эволюция», модель которой начинал разрабатывать русский филолог Юрий Тынянов. Применима ли эта концепция к отдельным частям произведения — например, к диалогу? Об исследованиях на эту тему пишет «Системный Блокъ».
...Литература, как и любая сложная система, развивается...
...Исследователь Института Макса Планка Олег Собчук в&...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Статьи номера посвящены произношению согласных, восприятию диалекта, карнавализации, семантике глагольных циркумфиксов и слова «Земля», а также языку образов времени и языку художественной литературы. Отметим некоторые из них.
...Статьи номера посвящены произношению согласных, восприятию...
...К семантике русских глагольных циркумфиксов. Циркумфикс...
В этом году наш портал впервые провел собственную акцию «Слово года». Присоединяясь к этому тренду, Грамота ставит перед собой задачу зафиксировать и проанализировать процессы, которые происходили в течение года в русской лексике, как с точки зрения чисто лингвистических новаций и трендов, так и с точки зрения отражения в лексике общественных настроений и образа жизни носителей русского языка. Выбор слова 2023 года был сделан на основе нескольких критериев: анализа ...
...В этом году наш портал впервые провел собственную акцию...