НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Картина русского языка к концу ХХ столетия изменилась. Одно из очевидных изменений — в лексике, прежде всего в таких сферах, как политическая, экономическая лексика. При этом изменения в русском языке не носят исключительного характера и не столь объемны, как это казалось некоторым лингвистам, слишком жестко увязывавшим политические события с языковой реальностью.
...Картина русского языка к концу ХХ столетия изменилась...
...Меру и степень состоявшихся и происходящих языковых...
Любимые всеми книги и фильмы часто рассказывают захватывающие и необычные истории. Но и таким форматам, как рекламный ролик или пост в блоге, чтобы попасть в топы просмотров, необходимо чем-то зацепить пользователя. Сегодня авторы нередко обращаются к генеративным языковым моделям в поисках вдохновения. Но есть ли в этом польза? Может быть, правы скептики, и их массовое применение убьет творчество? Исследователи Анил Доши из Лондонского ...
...Любимые всеми книги и фильмы часто рассказывают...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Проект «Слово Толстого» — цифровой...
Пять книг, которые мы выбрали, предназначены для широкого круга читателей. Они свидетельствуют об интересе к происхождению русского письма, который сохранялся на протяжении всего XX века. Из них вы узнаете, как возникли привычные нам буквы, чем кириллица отличается от глаголицы и при чем здесь греки и финикийцы.
...Пять книг, которые мы выбрали, предназначены для широкого...
...1. Елена Уханова. У истоков славянской письменности...
Корнский (Kernowek, англ. Cornish) — потомок древнего бриттского языка, на котором говорило коренное население острова Корнуэлл до прихода англосаксов. С V века число носителей языка постепенно сокращалось, а последние корноговорящие жители (для кого этот язык был первым и главным) умерли в конце XVIII века, хотя, по некоторым данным, язык в какой-то степени сохранялся и в течение XIX века. В 2009 году ООН признала язык ...
...Корнский (Kernowek, англ. Cornish) — потомок...
В новом выпуске — разговорная речь в качестве ресурса для коммерческих номинаций городских объектов, мем «суету навести охота», знаменитая «глокая куздра» лингвиста Льва Щербы и другие темы. Рассмотрим подробнее три статьи номера.
...В новом выпуске — разговорная речь в ...
...Разговорная речь как ресурс для коммерческих номинаций...