Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Проект «Слово Толстого» — цифровой...
Устная олимпиада по лингвистике — это интеллектуальное соревнование для школьников 8–11-х классов, где они смогут проявить свои знания в решении лингвистических задач. Задачи могут бытьт разными, порой совершенно неожиданными — например, на понимание жестовых языков, языка рыб и даже значения танцевальных фигур! Специальных знаний не требуется, а вот умение логически рассуждать очень пригодится. Хотя олимпиада не является перечневой (то есть не ...
...Устная олимпиада по лингвистике — это интеллектуальное...
Команда Грамоты за прошедшую неделю внесла несколько обещанных изменений в работу обновленного портала: размер поля для вопроса справочной службе увеличился до 1000 символов; добавлена возможность использовать в поисковой строке символы (* и ?), что позволяет искать в текстовых материалах сразу группу похожих слов; для большинства словарей в словарных статьях, которые появляются в результатах поиска, воспроизводится их исходная разметка. Кроме того, мы теперь с ...
...Команда Грамоты за прошедшую неделю внесла несколько...
33% россиян учат английский, чтобы уметь объясниться в поездках за рубежом. Об этом свидетельствуют результаты опроса онлайн-школы английского языка Skyeng, которые оказались в распоряжении «Газеты.Ru» и «Известий». Еще 30% отметили, что английский им нужен для чтения в оригинале литературы (профессиональной или художественной), а каждый пятый учит его, чтобы смотреть англоязычные фильмы и сериалы. Каждый десятый участник опроса ...
...33% россиян учат английский, чтобы уметь объясниться...
Из всех вопросов, на которые справочная служба Грамоты ответила в апреле, мы выбрали три, которые многим могут быть интересны. В них пользователи спрашивают про отдельные слова и формы, но, по сути, затрагивают более широкие проблемы: склонение существительных, омонимию падежей и орфографическое освоение иностранных заимствований.
...Из всех вопросов, на которые справочная служба Грамоты...
...Грамматика Вопрос: Скажите, пожалуйста, слова робот...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Слово зумер набрало 42% голосов специалистов. В группу лидеров также вошли выгорание (38%), ред-флаг (37%) и промпт (36%). В голосовании приняли участие 469 филологов из 23 организаций по всей России — из Москвы, Санкт-Петербурга, Владивостока, Владикавказа, Волгограда, Екатеринбурга, Перми, Ростова-на-Дону, Нижнего Новгорода, Майкопа, Петропавловска-Камчатского, Челябинска, Омска, Иркутска, Ставрополя, Красноярска, Калуги, Петрозаводска, Воронежа ...
...Слово зумер набрало 42% голосов специалистов....
Сравнение двух языковых моделей проводили методом Side-by-Side (букв. «бок о бок»). Обеим нейросетям предлагали один и тот же запрос, а затем эксперты выбирали лучший ответ вслепую (не зная, какой из сервисов его дал). Для эксперимента авторы брали обезличенные обращения пользователей продуктов «Яндекса» к нейросети YandexGPT 2. Выборка учитывала реальные потребности людей и охватила множество различных тем, сообщают в компании. По словам технического директора ...
...Сравнение двух языковых моделей проводили методом Side-by-Side...
25 января 2024 года в Балтийском федеральном университете им. И. Канта в восемнадцатый раз прошел Международный конкурс «Русский диктант онлайн». В этом году диктант был посвящен сразу двум памятным датам: 225-летию со дня рождения Александра Сергеевича Пушкина и трехсотлетнему юбилею Иммануила Канта. Среди участников были студенты и преподаватели из Узбекистана, Казахстана, Киргизии, Таджикистана, Армении и Беларуси, а также ...
...25 января 2024 года в Балтийском федеральном...