Сравнение двух языковых моделей проводили методом Side-by-Side (букв. «бок о бок»). Обеим нейросетям предлагали один и тот же запрос, а затем эксперты выбирали лучший ответ вслепую (не зная, какой из сервисов его дал). Для эксперимента авторы брали обезличенные обращения пользователей продуктов «Яндекса» к нейросети YandexGPT 2. Выборка учитывала реальные потребности людей и охватила множество различных тем, сообщают в компании. По словам технического директора ...
...Сравнение двух языковых моделей проводили методом Side-by-Side...
Поначалу слово из английского, французского или чешского языка кажется знакомым... и тут выясняется, что у него совершенно другое значение — иногда прямо противоположное. Любой, кто имеет дело с иностранными языками, хоть раз попадал впросак из-за «ложных друзей переводчика». Какие языковые процессы приводят к появлению таких слов? Можно ли их распознать и уберечься от ошибок?
...Поначалу слово из английского, французского или чешского...
...Что это за друзья такие Впервые эту метафору употребили...
Вежливость в моем представлении встроена в речь гораздо глубже, чем соблюдение речевого этикета; она предполагает не только правильный выбор этикетных знаков, но и навык использования коммуникативных стратегий.
...Вежливость в моем представлении встроена в речь...
...Вот уже несколько десятилетий лингвистика находится...
Коллективные ассоциативные поля похожи на клавиатуру. Писатель, как пианист, играет на этих клавишах. Он нажимает клавишу, молоточек бьет по струне — читатель слышит звук. Но если в мозгу читателя нужных струн не натянуто, то молоточек бьет в пустоту, звука нет, и что же тогда делать? Как прикажете играть на рояле без струн? А переводчик постоянно сталкивается с такой задачей.
...Коллективные ассоциативные поля похожи на клавиатуру...
...Для начала — один реальный случай и ...
Россияне за последний год стали читать больше книг в онлайн-библиотеках: трафик этих сервисов увеличился на 50%. Такие данные порталу AdIndex предоставил интернет-провайдер Yota. Самым популярным ресурсом по объему трафика стал «Литрес». На втором месте идет Bookmate, этот сервис показал самый большой рост трафика. Замыкает первую тройку MyBook. Общее число пользователей всех подобных платформ выросло на 1%. Каждый третий пользователь входит в категорию 26–35
...Россияне за последний год стали читать больше книг...
Насколько хорошо россияне помнят героев произведений русской литературы и обстоятельства жизни их авторов? Всероссийский центр изучения общественного мнения (ВЦИОМ) представил результаты телефонного опроса и предложил их интерпретацию. Участники исследования отвечали на четыре вопроса в пределах школьной программы. Все вопросы были открытыми, в формате «устного экзамена», так что угадать правильный ответ было нельзя. Часть вопросов содержала ...
...Насколько хорошо россияне помнят героев произведений...
В связи с шестидесятилетием действующих правил правописания предлагаем вниманию читателей архивную статью Сергея Ефимовича Крючкова, опубликованную 26 мая 1956 года в «Учительской газете». В этой статье сообщается об утверждении нового свода правил русского правописания, который официально действует до сих пор (сам свод правил был принят весной и издан в августе 1956 года, к началу нового учебного года). Автор рассказывает о принципах унификации правописания, о практических шагах по введению нового свода.
...В связи с шестидесятилетием действующих правил правописания...
...Предисловие «Грамоты.ру» Сергей Ефимович...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».
...За двадцать лет Национальный корпус русского языка...
...Первые корпусы появились в 1960-х годах, но тогда...