Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Недавнее исследование, проведенное учеными из ...
Коллектив молодежной лаборатории лингвистической антропологии Камчатского государственного университета им. Витуса Беринга существенно продвинулся в документировании языкового наследия региона. За 2024–2025 годы диалектологи описали 2916 слов камчатского наречия, оцифровали 7,5 часа архивных аудиозаписей. Это часть масштабной работы по созданию электронного ресурса «Краткий словарь русских говоров Камчатки». Территориальная разновидность русского языка на ...
...Коллектив молодежной лаборатории лингвистической антропологии...
В новом номере журнала «Русская речь» нас особенно заинтересовали статьи об искусственном интеллекте в медиа, о словообразовательной модели глаголов типа вслушаться и об изразцовых подписях XVIII века.
...В новом номере журнала «Русская речь...
...Язык в цифровую эпоху Искусственный интеллект...
О том, чем лингвистам интересны анекдоты, о своей лингвистической находке, об особенностях общения в интернете, а также о том, что отличает культурную речь от некультурной, порталу «Правмир» рассказал доктор филологических наук Алексей Шмелев.
...О том, чем лингвистам интересны анекдоты, о ...
...Анекдот — важная часть городского фольклора...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя. Это справочно-информационная платформа, созданная на основе девяностотомного собрания сочинений Льва Толстого, которая дает пользователю возможность проводить поиск по огромному корпусу текстов писателя, предоставляет справочные материалы как для специалистов, так и для широкого круга читателей. 19 ноября 2024 года проект презентовал цифровую хронику жизни Льва Толстого, основанную на ...
...Проект «Слово Толстого» — цифровой...
В литературных текстах прошлого есть странные для современного читателя цветообозначения. Кандидат филологических наук, переводчик и прозаик Мария Елифёрова в книге «Тайна синего вина и другие филологические истории» проясняет несколько загадок, связанных с цветом (и не только) в мировой литературе.
...В литературных текстах прошлого есть странные для современного...
...«Любопытство для ученого не порок, а норма жизни...
В новом выпуске цикла «Ученый совет» на портале Arzamas вышел разговор с Леонидом Петровичем Крысиным — доктором филологических наук, заведующим отделом современного русского языка Института русского языка им. В. В. Виноградова РАН. Он вспоминает о детстве, учебе в МГУ, знакомстве с Корнеем Чуковским, дружбе с Юрием Апресяном. Биография в десяти цитатах.
...В новом выпуске цикла «Ученый совет» на...
...1. Начало войны 6 июня 1941 года мне исполнилось шесть...
Представьте: вы договорились встретиться с другом на площади, но когда пришли — она оказалась переполненной. Все говорят, смеются, к тому же из динамиков гремит музыка. Вдруг вы замечаете в толпе друга. Как позвать его? Голос утонет в шуме. А теперь представьте, что вы заранее договорились хлопать в ладоши (или свистеть) в определенном ритме, чтобы сообщить о себе. Громкие ритмичные звуки будут выделяться на
...Представьте: вы договорились встретиться с ...
О запуске большого гуманитарного проекта будет официально объявлено в день рождения великого русского лексикографа Владимира Даля. «Слово Толстого» — цифровая платформа, созданная на основе 90-томного полного собрания сочинений Льва Толстого. Проект не только обеспечивает свободный доступ ко всем толстовским текстам (это было сделано на начальном этапе работы с полным собранием сочинений писателя в проекте «Весь Толстой в один клик»), но главное — создает ...
...О запуске большого гуманитарного проекта будет официально...