Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Ключевые слова в научных статьях, монографиях...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Комитет по внешним связям Санкт-Петербурга совместно с учебно-издательским центром «Златоуст» провели просветительские мероприятия по русскому языку, литературе и культуре России для преподавателей, филологов-русистов, учащихся из числа соотечественников. Подробности Недели русского языка в Узбекистане читайте в репортаже наших коллег.
...Комитет по внешним связям Санкт-Петербурга совместно...
...Участники Мероприятия проходили при поддержке...
Более 780 тыс. человек приняли участие в просветительской акции «Тотальный диктант», которая состоялась 9 апреля. В режиме онлайн диктант прошел в 108 странах, очно его написали в более чем 500 населенных пунктах в РФ и в 31 стране. Об этом в понедельник заявила директор фонда «Тотальный диктант» Ольга Ребковец на пресс-конференции в ТАСС.
...Более 780 тыс. человек приняли участие в просветительской...
Организаторы определили дату следующей акции «Тотальный диктант». Она пройдет 20 апреля 2024 года в двадцатый раз, сообщает ТАСС. Автора объявят в прямом эфире 8 сентября, в Международный день грамотности. В этот же день начнется отбор городов для участия в конкурсе «Столица Тотального диктанта». В 2023 году столицей диктанта был Нижний Тагил, а до этого — Санкт-Петербург, Якутск и Ярославль. Тотальный диктант впервые состоялся в 2004 году как акция студентов ...
...Организаторы определили дату следующей акции «...
Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...
...Как и люди, системы искусственного интеллекта...
Конференция «Язык, сознание, коммуникация: методология и гуманитарные практики (вызовы современности)» проводится в Москве совместно несколькими организациями, в том числе Институтом лингвистики и межкультурной коммуникации Сеченовского университета и филологическим факультетом МГУ им. М. В. Ломоносова. Среди разнообразных тем, которые предлагаются к рассмотрению: психолингвистические проблемы речевого общения и
...Конференция «Язык, сознание, коммуникация...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...