Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
За последние 30 лет эмодзи (смайлы) стали универсальным феноменом. К 2015 году, согласно исследованиям, 92% людей использовали их в онлайн-общении. Одна из причин популярности эмодзи в том, что они могут быть понятны каждому — по крайней мере базовые символы, обозначающие радость, грусть или гнев. Но даже их люди могут интепретировать по-разному, как выяснили авторы статьи в журнале PLOS ONE. К исследованию привлекли 253 добровольцев из ...
...За последние 30 лет эмодзи (смайлы) стали универсальным...
В СССР активно боролись за права женщин, но при этом названия многих профессий в русском языке чаще всего употребляются в мужском роде. Как передовые идеи равенства полов вписались в российский патриархальный контекст? И почему женщины обычно предпочитают, чтобы их называли врачами и медиками, а не врачихами и медичками?
...В СССР активно боролись за права женщин, но при этом...
...Тема русских феминитивов обширна и остроактуальна;...
Друзья! В день рождения «Грамоты.ру» (14 ноября порталу исполнилось 22 года) делимся с вами радостной новостью: вышел в свет «Объяснительный орфографический словарь (1–4 классы)». Его авторами стали старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, заместитель главного редактора портала «Грамота.ру» кандидат филологических наук Е. В. Арутюнова и научный сотрудник Института русского языка им. В. В. Виноградова ...
... Друзья! В день рождения «Грамоты.ру...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...Александр Антонов, руководитель группы оценки качества...
Не все в языке подчиняется правилам. Иногда мы руководствуемся обычаем, из-за чего возникают конкурирующие традиции. Например, кто-то ставит запятую в подписи, а кто-то — нет. Языковеды Дмитрий Ермолович и Павел Палажченко разбирают эту коллизию и предлагают свое обоснование правильного (с их точки зрения) варианта.
...Не все в языке подчиняется правилам. Иногда мы руководствуемся...
...«О том, чего нет и что не так в словарях...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...
Сравнение двух языковых моделей проводили методом Side-by-Side (букв. «бок о бок»). Обеим нейросетям предлагали один и тот же запрос, а затем эксперты выбирали лучший ответ вслепую (не зная, какой из сервисов его дал). Для эксперимента авторы брали обезличенные обращения пользователей продуктов «Яндекса» к нейросети YandexGPT 2. Выборка учитывала реальные потребности людей и охватила множество различных тем, сообщают в компании. По словам технического директора ...
...Сравнение двух языковых моделей проводили методом Side-by-Side...
2 июня, в преддверии книжного фестиваля «Красная площадь», на традиционном литературном обеде в Демонстрационном зале ГУМа были названы имена писателей, чьи произведения вошли в короткий список семнадцатого сезона национальной литературной премии «Большая книга». Об этом пишет сайт «Год литературы». Из 303 работ, выдвинутых на соискание премии в начале года, в длинный список вошли 49 произведений. Из них совет экспертов отобрал произведения 10 авторов. В финал ...
...2 июня, в преддверии книжного фестиваля «Красная...