Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...Современные генеративные модели, такие как ChatGPT,...
Производитель товаров для геймеров Razer анонсировал головную гарнитуру Razer Skibidi. В нее встроен переводчик с «brainrot-языка», на котором общается молодое поколение игроков (особенно представители поколения «альфа», родившиеся в начале 2010-х). Само слово скибиди в названии — типичный пример подросткового сленга, слово с размытым значением, обычно означающее что-то плохое, глупое и малопристойное. Помимо skibidi, переводчик распознает также слова ...
...Производитель товаров для геймеров Razer анонсировал...
Группа депутатов (Ярослав Нилов и другие) и сенатор Елена Афанасьева внесли в Государственную Думу законопроект, который предлагает сделать обязательным знание русского языка для всех категорий иностранных граждан, претендующих на получение гражданства РФ. Предлагаемые изменения коснутся пункта 2 статьи 16 («Прием в гражданство Российской Федерации отдельных категорий иностранных граждан и лиц без гражданства») Федерального закона «О гражданстве Российской ...
...Группа депутатов (Ярослав Нилов и другие) и сенатор...
Уже сейчас писатели издают книги, которые написаны ими в соавторстве с нейросетями. Спецпроект «Писатели vs Нейросети», созданный изданиями «Системный Блокъ» и «Подтекст», анализирует, какие этапы создания художественного текста может упростить нейросеть и насколько полезны языковые модели.
...Уже сейчас писатели издают книги, которые написаны...
...Кто лучше напишет рассказ? В ходе эксперимента писателю...
Насколько хорошо россияне помнят героев произведений русской литературы и обстоятельства жизни их авторов? Всероссийский центр изучения общественного мнения (ВЦИОМ) представил результаты телефонного опроса и предложил их интерпретацию. Участники исследования отвечали на четыре вопроса в пределах школьной программы. Все вопросы были открытыми, в формате «устного экзамена», так что угадать правильный ответ было нельзя. Часть вопросов содержала ...
...Насколько хорошо россияне помнят героев произведений...
Для эффективной коммуникации важно уметь распознавать тонкие нюансы смысла, выраженные словами. Как выясняется, у мозга есть алгоритм для случаев, когда смысл сообщения неочевиден. Это выяснила международная команда с участием специалистов в области нейронаук из НИУ ВШЭ. Исследователи смоделировали эксперимент, в котором участникам нужно было определить, что имеет в виду говорящий. На экране появлялись четыре характеристики и три монстра —
...Для эффективной коммуникации важно уметь распознавать...
Когда язык заимствует новое слово, его правописание и произношение не всегда очевидно и может варьироваться: например, нон-фикшен и нонфикшн, фэнтези и фентези… Мы составили список «проблемных» слов, которые часто ищут на Грамоте, чтобы напомнить, какова для них текущая орфографическая норма. И попробовали выявить закономерности или хотя бы подсказки, которые помогают предвидеть, как поведет себя заимствованное слово в русском языке.
...Когда язык заимствует новое слово, его правописание...
...1. Шорт-лист В чем сложность: раздельно, слитно или...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...