Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
К числу включенных в декабре 2023 года слов, называющих актуальные явления и предметы, относятся, например, датасет, ИИ, ИТ-профессия, ИТ-специалист, косплей, косплейный, косплеер, майнинг, маркетплейс, медиакарта, мурал, инвестиционно привлекательный. Словарь также пополнили термины разных специальностей и областей знания, например: благополучатель, инофон (человек, не владеющий русским языком, для которого русский язык неродной, дети-инофоны), каподастр (ограничитель на грифе ...
...К числу включенных в декабре 2023 года слов, называющих...
На примере проекта Chekhov Digital онлайн-журнал «Системный Блокъ» рассказывает о семантическом издании и о том, чем оно полезно.
...На примере проекта Chekhov Digital онлайн-журнал...
...Проект Chekhov Digital посвящен изучению литературного...
9 ноября Министерство просвещения опубликовало проект «новых», как писали о них СМИ, «Правил русской орфографии». Туда действительно вошли относительно новые слова вроде «риелтор», «каршеринг», «дилер», «пленэр» и многие другие. Но новые ли это правила и ждет ли нас языковая реформа? «Мел» разбирается вместе с лингвистами.
...9 ноября Министерство просвещения опубликовало проект...
...В частности, в статье приводится комментарий Владимира...
И пользователи Грамоты, и те, кто предпочитает бумажные издания, часто замечают, что один словарь рекомендует одно ударение, другой — другое, а третий вообще приводит оба варианта как равноправные. Если один словарь разрешает «кофе» в среднем роде, а другой возражает против такой вольности, кому верить? Ответ неочевиден, поскольку универсального словаря на все случаи жизни не существует. Более того, не все словари ставят перед собой задачу зафиксировать строгую норму. Как же тогда выбрать правильный вариант, какие критерии использовать, на что обращать внимание? Попробуем разобраться.
...И пользователи Грамоты, и те, кто предпочитает бумажные...
...Словари прескриптивные и дескриптивные Литературная...
Занятия по подготовке к тесту на сертификат «Русский как иностранный» 1-го и 2-го уровня в нашей школе проходят третий год. Тест состоит из пяти разделов: «Лексика и грамматика», «Чтение», «Аудирование», «Письмо» и «Говорение». Русскоязычные дети без особых усилий справляются с заданиями раздела «Лексика и грамматика». Выполнение заданий разделов «Чтение» и «Аудирование» требует разъяснения и тренировки (навыка медленного чтения, концентрации внимания на деталях). Лексика и синтаксические конструкции текстов не вызывают особых затруднений.
...Занятия по подготовке к тесту на сертификат «...
...Подготовка к сертификату предполагает, прежде...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Проект «Слово Толстого» — цифровой...
Этой осенью Грамота вступает в эпоху перемен. В чем будут заключаться эти перемены? Какая идея стоит за ними? И, самое главное, будет ли Грамота по-прежнему самым авторитетным сетевым источником сведений о русском языке? О смысле обновления и планах на будущее рассказывает главный редактор портала Ксения Киселева.
...Этой осенью Грамота вступает в эпоху перемен. В чем...
...Маска, я вас знаю? В ноябре 2023 года Грамоте исполнится...
Перед вами третье задание конкурса, в котором есть задачки попроще и посложнее.
...Перед вами третье задание конкурса, в котором есть...
...Задания попроще 1. Буквомешалки Смешав и переставив...