Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Проект «Слово Толстого» — цифровой...
Участники Тотального диктанта — люди, у которых есть мотивация писать грамотно. В чем тогда причина регулярных ошибок: сложные правила, редкие слова, недостатки школьного образования? Можно ли рассматривать ошибки как сигнал для изменения правил? Свой комментарий дала лингвист, член Филологического совета Тотального диктанта Светлана Викторовна Друговейко-Должанская.
...Участники Тотального диктанта — люди, у которых...
...Агнонимы Первая категория наиболее частотных ошибок...
Известно, что обсуждение с детьми книг с картинками без слов очень полезно для развития речи. Однако не всем детям нравится это занятие, а некоторым родителям оно может показаться скучным или вызывать стресс. Новое исследование, проведенное Флоридским Атлантическим университетом в сотрудничестве с Орхусским университетом в Дании, выявило альтернативный (и в чем-то более эффективный) способ развития речи ребенка. Это беседы о прошедших ...
...Известно, что обсуждение с детьми книг с ...
Чтобы возникла лаконичная и удобная система Брайля, понадобилось объединить достижения человеческой мысли в разных областях: идеи просветителей, усилия педагогов, мастерство криптографов. Спустя двести лет шрифт Брайля не устарел и сегодня востребован в цифровом мире.
...Чтобы возникла лаконичная и удобная система Брайля...
...Новаторы XIX века В 1824 году пятнадцатилетний...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...
Мария Леонидовна Каленчук — главный научный сотрудник и заведующая отделом фонетики Института русского языка им. В. В. Виноградова РАН, член Совета по русскому языку при Президенте РФ, член Орфографической комиссии и председатель Орфоэпической комиссии РАН, эксперт Грамоты. Ее монолог на «Арзамасе» начинается с детства, учебы в школе и в институте и заканчивается признанием в любви к фонетике и описанием процесса создания словарей. Мы выбрали пять цитат из этого монолога.
...Мария Леонидовна Каленчук — главный научный...
...Есть такой предмет «введение в языкознание...
Workspace Digital Awards — престижная отраслевая премия в сфере digital. Ежегодно участие в ней принимают лучшие агентства, дизайн-студии и команды. В рамках конкурса оцениваются кейсы, поданные агентствами через личный кабинет Workspace. Победители определяются в три этапа посредством народного голосования и голосования жюри, в которое входят лидеры отрасли: представители известных брендов, арт-директора, владельцы компаний. Грамота соревновалась ...
...Workspace Digital Awards — престижная отраслевая...
Приятель брата — Митя или Дима? А новая коллега — Женя или Евгения? Анна Ивановна считает себя начальником или начальницей? Как описать соседа: он глухой или с нарушениями слуха? Во многих ситуациях нам приходится делать этот непростой выбор. На что лучше ориентироваться: на мнение того, о ком речь, на правила языка или на собственное удобство? Грамота расспросила об этом популяризатора лингвистики, кандидата филологических наук Александра Пиперски.
...Приятель брата — Митя или Дима? А новая...
...Выбор имени: родители, святцы и другие алгоритмы...