Сравнение двух языковых моделей проводили методом Side-by-Side (букв. «бок о бок»). Обеим нейросетям предлагали один и тот же запрос, а затем эксперты выбирали лучший ответ вслепую (не зная, какой из сервисов его дал). Для эксперимента авторы брали обезличенные обращения пользователей продуктов «Яндекса» к нейросети YandexGPT 2. Выборка учитывала реальные потребности людей и охватила множество различных тем, сообщают в компании. По словам технического директора ...
...Сравнение двух языковых моделей проводили методом Side-by-Side...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...
Перед вами третье задание конкурса, в котором есть задачки попроще и посложнее.
...Перед вами третье задание конкурса, в котором есть...
...Задания попроще 1. Буквомешалки Смешав и переставив...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Когда мы много знаем о какой-то теме, бывает трудно написать о ней так, чтобы наша мысль была понятна неспециалисту. Когнитивный психолог и психолингвист Стивен Пинкер предлагает несколько стратегий улучшения качества письма, которые помогут писать ясные и эффективные тексты с учетом разницы в картине мира между экспертом и его аудиторией.
...Когда мы много знаем о какой-то теме, бывает трудно...
...Стивен Пинкер известен своими увлекательными рассуждениями...
В жизни нам приходится запоминать огромное количество информации, особенно в связи с учебой. Простая зубрежка не просто отнимает много сил и времени, но и зачастую неэффективна. На помощь приходят мнемонические приемы, которые значительно упрощают процесс запоминания. В русском языке немало непростых правил, которые хорошо иллюстрируют мнемонические фразы. Мы постарались собрать самые известные приемы, чтобы «разложить по полочкам» спряжения, падежи, ударения и многое другое.
...В жизни нам приходится запоминать огромное количество...
...Как работает мнемоника Мнемоника (от др.-греч. &mu...
В новом выпуске — разговорная речь в качестве ресурса для коммерческих номинаций городских объектов, мем «суету навести охота», знаменитая «глокая куздра» лингвиста Льва Щербы и другие темы. Рассмотрим подробнее три статьи номера.
...В новом выпуске — разговорная речь в ...
...Разговорная речь как ресурс для коммерческих номинаций...
Специалисты компании «Яндекс» научили нейросеть создавать выжимку из текстов на русском языке и представлять его основные идеи в виде тезисов. Статью объемом до 30 тысяч знаков можно сократить до небольшого конспекта в 300–1000 знаков. Протестировать функцию может любой желающий, зайдя через «Яндекс.Браузер» на сайт 300.ya.ru. Нужно просто загрузить ссылку на нужный материал, и нейросеть переработает его. Тезисы появятся в том же окне. Ссылку на краткое содержание ...
...Специалисты компании «Яндекс» научили нейросеть...
В современном русском языке принято выделять шесть падежей, но в интернете периодически возникают дискуссии по поводу их количества — особо смелые авторы увеличивают число вдвое. Лингвист Алексей Лебедев в статье для журнала «Наука и жизнь» показывает, что почти все якобы исчезнувшие падежи можно считать либо частными случаями основных шести, либо особыми формами слов.
...В современном русском языке принято выделять шесть...
...В древнерусском языке действительно было больше...