Современные генеративные модели, такие как ChatGPT, уже активно применяются для написания научных статей и выпускных работ. Выявить разницу между человеческим и сгенерированным текстом становится всё труднее. При этом квалификационные, другие учебные и научные работы предполагают академическую честность, поэтому необходимы инструменты для выявления таких фрагментов. Команда исследователей из НИУ ВШЭ создала две программы для выявления в научных текстах фрагментов, созданных ...
...Современные генеративные модели, такие как ChatGPT,...
16–17 октября в Таврическом дворце Санкт-Петербурга состоялась конференция «Русский язык — основа интеграционного диалога в регионе СНГ». Мероприятие, организованное Межпарламентской Ассамблеей СНГ (МПА СНГ) и Советом Федерации, собрало более 700 участников из 18 стран, включая все государства Содружества. На конференции было представлено около 200 докладов, охватывающих роль русского языка в образовании, праве, искусстве, цифровых технологиях и
...16–17 октября в Таврическом дворце Санкт-Петербурга...
К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Инициатива Crowdsourcing Romeyka, возглавляемая профессором Кембриджского университета Иоанной Ситариду, приурочена к Международному десятилетию языков коренных народов (2022–2032), объявленному ООН. Его цель — «привлечение внимания мировой общественности к критическому положению многих языков коренных народов и мобилизация заинтересованных сторон и ресурсов для их сохранения, возрождения и продвижения». Ромейка считается исчезающим ...
...Инициатива Crowdsourcing Romeyka, возглавляемая ...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Элисон Вуд Брукс преподает в Гарвардской школе бизнеса и специализируется в области психологии общения. Она более десяти лет занимается исследованием коммуникации и ведет собственный курс под названием TALK. Книга «Простой сложный разговор. Модель легкого и эффективного общения» посвящена важным принципам и тонкостям общения, которые помогут избежать ошибок в разговоре. На русском языке она вышла в издательстве МИФ.
...Элисон Вуд Брукс преподает в Гарвардской школе бизнеса...
...Разговор — не такая легкая вещь, как...
В блоке команды чат-бота BotHub на портале «Хабр» вышла статья о том, может ли машинный интеллект находить и исправлять ошибки в русскоязычном тексте, как настоящий корректор. Для испытания автор отобрал 13 популярных инструментов — от передовых языковых моделей до специализированных корректорских сервисов.
...В блоке команды чат-бота BotHub на портале...
...Методология Автор стремился выжать из ИИ-корректоров...
Люди давно поняли, что записывать слова от руки — слишком трудоемкий процесс. Чтобы быстро делиться большими объемами информации, нужно было этот процесс упростить и ускорить. И вот примерно полтора века назад решение было найдено. С тех пор человечество стучит по клавишам.
...Люди давно поняли, что записывать слова от руки &mdash...
...«Ремингтон» и скорописец Английский инженер...
Истоки китайской науки о языке восходят к концу I тысячелетия до н. э. На протяжении многих столетий в качестве основного объекта исследования в ней выступал иероглиф. Вот почему вплоть до ХХ века в китайском языкознании внимание исследователей было сосредоточено на изучении начертания, чтения и истолкования иероглифов. В центре китайской науки о языке, таким образом, находились графика, фонетика и лексикография, от которой шел путь и к этимологии.
...Истоки китайской науки о языке восходят к ...
...Китайская грамматика, как ни странно, —...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...