Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Юрий Кнорозов совершил то, что все его предшественники считали невозможным. Из статьи журнала «Наука и жизнь» становится понятно, как годы кропотливого труда помогли ученому осуществить его студенческую мечту — расшифровать таинственные письмена древней индейской цивилизации.
...Юрий Кнорозов совершил то, что все его предшественники...
...Лингвист Юрий Кнорозов еще в студенчестве заинтересовался...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...
Множество людей мечтают выучить иностранный язык, хотя бы один, а лучше несколько. Чаще из практической необходимости, а иногда и просто для души: чтобы читать на них книги, смотреть фильмы, путешествовать, общаться, узнавать чужую культуру. Авторы книг, которые мы рекомендуем, делятся опытом и советами, помогая каждому найти свой способ изучать языки быстрее, эффективнее и веселее. Но волшебной палочки, чтобы выучить язык за месяц, тут нет; только описание когнитивных механизмов и разных способов поддерживать мотивацию.
...Множество людей мечтают выучить иностранный язык, хотя...
...1. Анастасия Иванова. Свободно говорю. Как учить иностранные...
В последнее время все чаще высказывается мнение о том, что слово «Интернет» надо писать со строчной (маленькой) буквы. Основной аргумент сторонников такого написания: Интернет стал единой, всемирной, общераспространенной информационной сетью, таким же общепринятым средством передачи информации, как, например, телефон.
...В последнее время все чаще высказывается мнение о том...
...Пишем же мы это слово со строчной буквы! Но справедлива...
О запуске большого гуманитарного проекта будет официально объявлено в день рождения великого русского лексикографа Владимира Даля. «Слово Толстого» — цифровая платформа, созданная на основе 90-томного полного собрания сочинений Льва Толстого. Проект не только обеспечивает свободный доступ ко всем толстовским текстам (это было сделано на начальном этапе работы с полным собранием сочинений писателя в проекте «Весь Толстой в один клик»), но главное — создает ...
...О запуске большого гуманитарного проекта будет официально...
Первая основана на результатах диалектологической экспедиции во Владимирскую область, а вторая иллюстрирует на разных примерах такое языковое явление, как синтаксическая редупликация.
...Первая основана на результатах диалектологической экспедиции...
...Муромское ёканье Примеры, которые собрали лингвисты...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...