Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Германский археологический институт провел раскопки на холме Гёбекли-Тепе (Пупочная гора) на юго-востоке Анатолии. О результатах рассказывает статья в журнале «Наука и жизнь».
...Германский археологический институт провел раскопки...
...Специалисты в ходе раскопок обнаружили многочисленные...
Пока политики ищут национальную идею, которая смогла бы консолидировать общество, такая идея, как представляется, уже овладела умами россиян: самоидентификация идет в поле русского языка. Трехлетний опыт общения с аудиторией программ «Как правильно?» и «Говорим по-русски!» (а вопросы от слушателей поступают к нам из более чем 70 городов России от носителей языка самых разных возрастов и социального положения, что позволяет считать нашу многомиллионную аудиторию неким представительным срезом общества) показывает: реформа орфографии заставляет испытывать тревогу и вызывает не меньший, если не больший интерес, чем проводимые экономические и социальные реформы.
...Пока политики ищут национальную идею, которая смогла...
...Своеобразным пропуском в элиту общества кажется не...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Аналитический центр ВЦИОМ изучил, как россияне относятся к обсценной лексике. Оказалось, что семь из десяти опрошенных хотя бы иногда используют нецензурные ругательства. Доля тех, кто матерится ежедневно, за последние 17 лет выросла значительно — с 20% до 34%. Мужчины и молодежь (зумеры и младшие миллениалы) являются основными «источниками» мата: почти половина мужчин и две трети зумеров используют нецензурную лексику ежедневно. А вот географических различий в ...
...Аналитический центр ВЦИОМ изучил, как россияне относятся...
Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...
...Как и люди, системы искусственного интеллекта...
Существуют ли языковые способы мотивировать людей к действию — или эффект больше зависит от того, кто говорит, от настроения аудитории и качества аргументов? Исследователи из Университета социальных и гуманитарных наук в Варшаве и Падуанского университета нашли подтверждения первой гипотезы. На основе существующих представлений о том, как люди стремятся к целям, авторы предположили, что успешная мотивирующая коммуникация (в виде текста) ...
...Существуют ли языковые способы мотивировать людей к...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...