Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...
Каким образом можно увидеть разницу в картине мира на конкретных языковых примерах? Журнал «Наука и жизнь» приводит интересные случаи такого рода в английском и русском языках.
...Каким образом можно увидеть разницу в картине мира...
...Грамматические и лексические особенности того языка...
В этот раз из всех вопросов, на которые справочная служба Грамоты ответила в мае, мы выбрали три очень разных. Один вопрос затрагивает новые, неоднозначно воспринимаемые явления в разговорной речи. Чтобы ответить на другой, наши консультанты глубоко погрузились в морфологические тонкости. А еще один вопрос нам задают очень часто (а подобные ошибки мы видим еще чаще), так что у него есть шанс попасть в число горячих.
...В этот раз из всех вопросов, на которые справочная...
...Орфография Вопрос: В слове молоденький суффикс...
Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...
...Как и люди, системы искусственного интеллекта...
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Ключевые слова в научных статьях, монографиях...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
В этом выпуске Наталья Брагина, доктор филологических наук, профессор Института Пушкина, говорит о речевых клише. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...В этом выпуске Наталья Брагина, доктор филологических...
...Какими свойствами обладают клише? Они всегда...
В выпуске программы «Говорим по-русски!», подготовленном к Пасхе, вас ждут серьезный разговор и интересные факты. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...В выпуске программы «Говорим по-русски!»...
...Александр Кравецкий, руководитель Научного центра по...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...