Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Чат-боты GPT и другие: что думают лингвисты о больших...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...
...Приличное поведение больших языковых моделей может...
...Как и люди, системы искусственного интеллекта...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Новый подход поможет людям более успешно общаться с...
...Большие языковые модели — подобные тем,...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Исследование: внутренний язык больших языковых моделей...
...Большинство нейросетевых языковых моделей обучаются...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Проблема различения языка и диалекта не перестает быть актуальной для взаимоотношений разных народов и стран. От лингвистов требуют предъявить строгие научные критерии разграничения этих понятий, но в действительности едва ли не большую роль играют экстралингвистические факторы.
...Проблема различения языка и диалекта не перестает быть...
...Разные языки или разные диалекты?...
...Задача с двумя неизвестными Представим, что есть два...
Предки русских, англичан, французов, иранцев, армян, таджиков, греков, части народов Индии и других народов много тысяч лет назад говорили на одном языке, который ученые называют праиндоевропейским. Так что русский язык — не только славянский, о чем всем известно; он также входит в большую и пеструю семью потомков праиндоевропейского языка. В чем проявляется это родство?
...Предки русских, англичан, французов, иранцев, армян...
...Русский как индоевропейский: общие корни заметны даже...
...Индоевропейские языки и другие языковые семьи...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Благодя цифровизации науки многие полезные справочные...
...Современные онлайн-ресурсы расширяют возможности исследователей...
...1. Новое в русской лексике База данных снабжена...
Люди давно поняли, что записывать слова от руки — слишком трудоемкий процесс. Чтобы быстро делиться большими объемами информации, нужно было этот процесс упростить и ускорить. И вот примерно полтора века назад решение было найдено. С тех пор человечество стучит по клавишам.
...Люди давно поняли, что записывать слова от руки &mdash...
...Всемирная история клавиатур: от букв вместо цифр до...
...«Ремингтон» и скорописец Английский инженер...
Большую часть своей жизни в науке я занималась теоретической фонетикой и фонологией, развивая идеи Московской фонологической школы. Но в последние годы я увлеклась проблемами кодификации произносительных норм. И есть один аспект, связанный с произносительными рекомендациями в орфоэпических словарях, который меня и тревожит, и раздражает, — это отсутствие данных о процедуре принятия кодификационных решений, положенных в основу того или иного словаря.
...Большую часть своей жизни в науке я занималась теоретической...
...Мария Каленчук: «Нормативные рекомендации должны опираться...
...В теоретических статьях к словарю обычно тщательно...