На YouTube-канале «Основа», который ведет режиссер и блогер Борис Веденский, уже год регулярно появляются интервью со специалистами в разных областях и представителями разных наук, которые умеют популяризировать научные знания, заинтересовывать своей областью самую широкую аудиторию. Гостями канала уже побывали лингвисты Владимир Пахомов, Федор Успенский, Игорь Исаев, Георгий Старостин.
...На YouTube-канале «Основа», который ведет...
...На канале «Основа» вышел разговор с Александром Пиперски...
...Александр Пиперски в разговоре с ведущим...
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Российские исследователи предложили новую модель генерации...
...Ключевые слова в научных статьях, монографиях...
На нашей планете тысячи языков. Они относятся к разным языковым группам и семьям, а диалекты внутри них могут отличаться настолько сильно, что специалисты спорят, не стоит ли их считать отдельными языками. Почему это многообразие нас так завораживает? Возможно, одну из причин назвал Петр Вяземский: «Язык есть исповедь народа: в нем чудится его природа, его душа и быт родной».
...На нашей планете тысячи языков. Они относятся к разным...
...Почему языки такие разные...
...Мы выбрали для вас несколько книг об историческом развитии...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Слово и его окружение Идея представления слова...
Люди давно поняли, что записывать слова от руки — слишком трудоемкий процесс. Чтобы быстро делиться большими объемами информации, нужно было этот процесс упростить и ускорить. И вот примерно полтора века назад решение было найдено. С тех пор человечество стучит по клавишам.
...Люди давно поняли, что записывать слова от руки &mdash...
...Всемирная история клавиатур: от букв вместо цифр до...
...«Ремингтон» и скорописец Английский инженер...
Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...
...Приличное поведение больших языковых моделей может...
...Как и люди, системы искусственного интеллекта...
Восьмого апреля в 43 странах прошла акция «Тотальный диктант». Четыре фрагмента текста Василия Авченко написали онлайн и на очных площадках. «Участники из 43 стран написали двадцатый диктант в очном формате, 103 страны присоединились к акции в рамках онлайн-марафона и онлайн-диктанта. В России диктант фирменной юбилейной ручкой xGold на очных площадках написали более 125 000 человек. Больше всего участников в России традиционно собралось в Москве, куда пришли чуть ...
...В Тотальном диктанте — 2023 приняли участие 456 307...
...Восьмого апреля в 43 странах прошла акция «Тотальный...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Чат-боты GPT и другие: что думают лингвисты о больших...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Исследование: внутренний язык больших языковых моделей...
...Большинство нейросетевых языковых моделей обучаются...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Новый подход поможет людям более успешно общаться с...
...Большие языковые модели — подобные тем,...