нури абдель раззак | Журнал | Поиск по Грамоте

Российские исследователи предложили новую модель генерации ключевых слов к научным текстам

Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...

...Ключевые слова в научных статьях, монографиях...

Что такое векторные модели и как можно их использовать

Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.

...Векторное представление слова в компьютерной лингвистике...

...Слово и его окружение Идея представления слова...

Чат-боты GPT и другие: что думают лингвисты о больших языковых моделях

Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.

...Со второй половины 2010-х годов компьютерные языковые...

...Получившая громкую известность аббревиатура GPT расшифровывается...

Обучение и самообучение: как синтетические данные влияют на работу больших языковых моделей

Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.

...Нейросети учатся на текстах, созданных человеком. Но...

...Грамота: Одна из страшилок, связанных с развитием...

Склонение грузинских фамилий в русском языке

У носителей русского языка часто возникают трудности при склонении фамилий, особенно иноязычного происхождения. В справочную службу Грамоты регулярно поступают вопросы на эту тему. И хотя все ответы можно найти в «Письмовнике», попробуем более пристально посмотреть на некоторые типы фамилий и разобраться, в каких случаях они склоняются, а в каких нет.

...У носителей русского языка часто возникают трудности...

...Какие фамилии — грузинские? Грузия ...

Приличное поведение больших языковых моделей может быть обманчивым

Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...

...Как и люди, системы искусственного интеллекта...

Исследование: внутренний язык больших языковых моделей ближе всего к английскому

Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...

...Большинство нейросетевых языковых моделей обучаются...

Новый подход поможет людям более успешно общаться с большими языковыми моделями

Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.

...Большие языковые модели — подобные тем,...

Исследователи предложили новую биокультурную модель возникновения языка

Долгое время среди научных журналистов и даже среди лингвистов была популярна идея «серебряной пули». Считалось, что уникальная языковая способность человека возникла благодаря одному конкретному событию — например, случайной генетической мутации. Эта теория объясняла язык как внезапно возникший инстинкт, но оставляла за скобками вопрос: почему другие животные, обладающие развитым мозгом, так и не заговорили. Новая работа, опубликованная в

...Долгое время среди научных журналистов и даже...

Между эмбрионом и покойником: где расположены роботы на шкале одушевленности

Из всех вопросов, на которые справочная служба Грамоты ответила в апреле, мы выбрали три, которые многим могут быть интересны. В них пользователи спрашивают про отдельные слова и формы, но, по сути, затрагивают более широкие проблемы: склонение существительных, омонимию падежей и орфографическое освоение иностранных заимствований.

...Из всех вопросов, на которые справочная служба Грамоты...

...Грамматика Вопрос: Скажите, пожалуйста, слова робот...

Почитать на грамоте