Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Заимствования — тема, неизменно вызывающая беспокойство общественности: вдруг родной язык захлебнется под их валом? Волны заимствований в русском, как и в других языках, бывали неоднократно. Но иноязычное обозначение нового вида деятельности спустя время может быть вытеснено чем-то «более родным». Три таких истории, о которых рассказывает лингвист Ирина Фуфаева, начались на заре ХХ века, века скоростей и техники.
...Заимствования — тема, неизменно вызывающая...
...Тот, кто летает Первая история связана с появлением...
В школе говорят, что в русском языке у существительных, глаголов и других частей речи есть только две формы числа — единственное и множественное. Но исторически русский, как и многие другие языки, имел еще и двойственное число. Почему категория двойственности была утрачена? Как выглядели формы двойственного числа в древнерусском языке и где мы можем увидеть их следы?
...В школе говорят, что в русском языке у ...
...Что такое двойственное число Двойственное число, или...
«Зубодробительный», «заумный», «трескучий» — так говорят про язык законов, инструкций, договоров и соглашений. Мы привыкли мириться с ним, раз «так нужно». Но государство и бизнес наконец сами задумались о том, чтобы говорить проще. Какие есть инструменты, которые им в этом помогут?
...«Зубодробительный», «заумный»...
...Какой язык называют простым Простой язык (plain language...
На портале для киноманов IndieWire вышла статья «Сконструированные языки не всегда добираются до финальной версии фильмов, но „Дюна: часть вторая“ показывает, почему они должны там быть». Дэвид Питерсон, известный как создатель дотракийского и валирийского языков для сериала «Игра престолов», и его жена и коллега Джесси рассказали изданию о своей работе над чакобса, языком фрименов. Грамота публикует перевод этой статьи.
...На портале для киноманов IndieWire вышла статья «...
...Известного рода фанатам когда-то приходилось гоняться...
Как в точности соотносятся церковнославянский, старославянский и древнерусский языки? На это вопрос даже многие выпускники филологических факультетов не могут дать внятный ответ. При этом если древнерусский и старославянский остались в далеком прошлом, церковнославянский жив и сегодня, хотя и для ограниченного круга людей. Как сложилась его судьба и чем он интересен с лингвистической точки зрения? Об этом Грамота поговорила с ведущим научным сотрудником Института русского языка им. В. В. Виноградова РАН, руководителем научного центра по изучению церковнославянского языка и проекта создания Большого словаря церковнославянского языка Нового времени Александром Геннадьевичем Кравецким.
...Как в точности соотносятся церковнославянский, старославянский...
...Грамота: В чем все-таки разница между древнерусским...
Когда мы говорим «словарь», какие издания приходят в голову прежде всего? Наверняка кто-то вспомнит словари Даля, Ожегова и Ушакова, филологи назовут словарь Фасмера, люди старшего поколения — энциклопедию Брокгауза и Ефрона. Словарные статьи в нашем представлении обычно начинаются со слова или словосочетания и следуют друг за другом в алфавитном порядке. Но есть словари, которые устроены совсем иначе: в них единицы отобраны и организованы в единое целое по другим принципам.
...Когда мы говорим «словарь», какие издания...
...Что нового могут придумать лексикографы Лексикография...
Разные словари необходимы для разных задач. Какими-то пользуются только специалисты, другие нужны тем, кто так или иначе работают с языком, — учителям, школьникам, студентам, редакторам, публицистам. Расскажем о пяти самых востребованных типах словарей для широкого круга пользователей: толковом, орфографическом, словаре ударений, двуязычном и словаре синонимов.
...Разные словари необходимы для разных задач. Какими-то...
...Изначально словари были рукописными, малого объема...
За последние несколько недель прошла волна мероприятий и публикаций по поводу русского языка, словно давняя озабоченность наконец-то оформилась в конкретные мысли и отчетливые намерения. Это прежде всего акция «Народный диктант», инициаторы которой — журналисты «Российской газеты» — поставили эксперимент на себе и тем самым заслужили право предложить проверить свои знания по русскому языку отечественным чиновникам и политикам всех уровней и ветвей власти. За диктантом «по Льву Толстому» последовали выступления известных языковедов и деятелей культуры о русском языке как родном, как языке межнационального общения и как одном из мировых языков.
...За последние несколько недель прошла волна мероприятий...
...Однако на самом деле широкую общественность и филологическое...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...