Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...это может проявляться в обилии вводных слов вроде...
Производитель товаров для геймеров Razer анонсировал головную гарнитуру Razer Skibidi. В нее встроен переводчик с «brainrot-языка», на котором общается молодое поколение игроков (особенно представители поколения «альфа», родившиеся в начале 2010-х). Само слово скибиди в названии — типичный пример подросткового сленга, слово с размытым значением, обычно означающее что-то плохое, глупое и малопристойное. Помимо skibidi, переводчик распознает также слова ...
...харизма’) и десятки других, а еще сокращения вроде...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Ранее в моделях вроде LangID преобладал универсальный...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
..., который характерен для больших языковых моделей вроде...
Говоря о выборе системы письма, мы не будем затрагивать вопросы исконного, если можно так выразиться, выбора: происхождения систем письма и формирования письменных ареалов. Далее будет говориться лишь о ситуации последних веков, включая современность.
...Говоря о выборе системы письма, мы не будем затрагивать...
...системы письма (не путать с более частными мерами вроде...
...Даже более частные меры вроде орфографической реформы...
Известно, что обсуждение с детьми книг с картинками без слов очень полезно для развития речи. Однако не всем детям нравится это занятие, а некоторым родителям оно может показаться скучным или вызывать стресс. Новое исследование, проведенное Флоридским Атлантическим университетом в сотрудничестве с Орхусским университетом в Дании, выявило альтернативный (и в чем-то более эффективный) способ развития речи ребенка. Это беседы о прошедших ...
...требования, односторонние указания), чаще звучали вопросы вроде...
Подростки активно используют продукты с генеративным искусственным интеллектом (генИИ) для решения учебных задач, борьбы со скукой и перевода текстов с других языков. При этом родители и учителя отстают от них в понимании этих технологий. Об этом говорят данные опроса Common Sense Media — независимой НКО, которая предоставляет обзоры и рейтинги медиа и технологий с целью информирования общества об их влиянии на детей и подростков1.
...В первую десятку также попали варианты вроде &...
Понимание текста зависит не только от того, какие слова в нем используются, но и от его синтаксической структуры предложений, из которых он состоит. Российские психолингвисты провели исследование, чтобы понять, с какого возраста дети могут правильно интерпретировать сложные предложения. В исследовании Центра языка и мозга НИУ ВШЭ приняли участие 145 русскоязычных учащихся 1–4 классов и столько же взрослых. Всем им предложили прослушать набор сложных предложений разных типов и
...где требовалось осмыслить соотношение признаков, вроде...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...веб-скрейпинга стало сложнее добывать, так как платформы вроде...
В современном русском языке принято выделять шесть падежей, но в интернете периодически возникают дискуссии по поводу их количества — особо смелые авторы увеличивают число вдвое. Лингвист Алексей Лебедев в статье для журнала «Наука и жизнь» показывает, что почти все якобы исчезнувшие падежи можно считать либо частными случаями основных шести, либо особыми формами слов.
...В современном русском языке принято выделять шесть...
... Формы вроде выпить чаю или добавить сахару...