Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Получить всю картотеку одним кликом и другие, менее...
...Девятнадцать лет назад в России появился электронный...
...Здесь собраны только поэтические тексты, которые размечены вручную, отдельной рабочей группой....
...Раньше нужно было прочитать сотни текстов и вручную выписать фрагменты на карточки, чтобы таким образом собрать картотеку примеров, в которых присутствует какое-то слово, конструкция или явление....
...В мультимедийном корпусе есть еще более сложная разметка: например, там вручную маркируются жесты и речевые действия. Для специалистов, которые изучают жесты и связь между словами и жестами, эта информация бесценна....
...Кому и зачем нужен Национальный корпус русского языка...
Инструменты, о которых пойдет речь ниже, не сделают всю работу за редактора, но способны существенно упростить ему жизнь. Они не только возьмут на себя рутинные задачи, такие как проверка орфографии и степени оригинальности текста, оформление списка литературы или замена кавычек, но и подскажут удачные решения в более сложных областях.
...Можно автоматизировать часть процессов, чтобы осталось...
...Инструменты, о которых пойдет речь ниже, не сделают...
...Правда, расшифровку придется вручную разбивать на абзацы и исправлять неверно распознанные слова (особенно имена, названия, термины). Так, однажды ИИ почему-то решил, что у имени Вера есть полная форма и везде написал уважительно Версия Ивановна....
...Цифровые инструменты в помощь редактору...
Иоланта не только пишет и редактирует тексты, но и сама публикует их в соцсетях и мессенджерах. Свой первый материал она написала, когда устала отвечать на назойливые вопросы зрячих людей.
...История незрячего редактора Иоланты, которая благодаря...
...Иоланта не только пишет и редактирует тексты,...
...Современные синтезаторы часто снабжены хорошими словарями, в которых указано произношение слов, но приятно, если их иногда можно редактировать вручную, потому что ошибки все равно бывают....
...«Я хочу продолжать работать с текстами»...
Пользователи Грамоты часто задают справочной службе вопрос о том, как писать какое-нибудь слово — с большой или с маленькой? «Транссибирская» или «транссибирская» магистраль, «Танины» или «танины» вещи, «Председатель» или «председатель», и, наконец, «Вы» или «вы»? Выбор между строчной и прописной буквой в русском правописании действительно устроен непросто. Он во многом определяется традицией, а правила, которые его регулируют, несколько раз менялись.
...Если речь не об именах собственных и не о начале предложения...
...Пользователи Грамоты часто задают справочной службе...
...Когда было изобретено книгопечатание, на станках все буквы были одного размера, поэтому заглавные буквы добавляли (прописывали) вручную. Отсюда, по одной из версий, и возникло другое название для большой буквы — прописная....
...Как правильно, с большой или с маленькой?...
Новый сервис создала компания SberDevices — партнер Сбера. По данным разработчиков, модель на основе искусственного интеллекта обучена на примерах, покрывающих большинство часто встречающихся источников текста и их особенностей: новости, социальные сети, отзывы, субтитры, интернет-страницы, блоги и статьи. Сервис поддерживает только русский язык и не исправляет пунктуацию — она остается на усмотрение автора. Объем текста, который можно загружать для ...
...Он исправляет случайные ошибки, но оставляет особенности...
...В процессе обучения эксперты вручную исправляли только ненамеренные ошибки, а особенности авторского стиля, в том числе соцсетевого, — «ОМГ», «сто проц» и т. д. — оставляли без изменений....
...Сбер представил сервис проверки орфографии на основе...
В конференции участвовали лингвисты, лексикографы, руководители электронных библиотек. Вела конференцию член редакционного совета «Грамоты.ру» Юлия Сафонова.
...Стенограмма конференции о ресурсах в интернете, посвященных...
...В конференции участвовали лингвисты, лексикографы,...
...Это несопоставимо с тем, что делали в докомпьютерную эпоху, выписывая на карточки вручную, — это такой результат технического прогресса. Кроме того, не только традиционные задачи можно решать с помощью корпуса, но и новые....
...Это инструментарий, а с инструментарием уже трудно работать просто так, вручную, на столе. Первый звоночек прозвенел еще в начале 1990-х годов, когда у «Британники» резко упали тиражи после того, как вышли первые диски с электронной версией....
...Это разнообразная информация о языке, которая вносится в корпус специалистами автоматически или вручную, и специальная программа находит интересующие фрагменты текста. Чем больше мы внесем в корпус, тем больше в нем будет всего интересного. Вот пример разметки (на экране)....
...Русский язык в интернете: RU-да или RU-нет?...
Портал «Грамота.ру» следит за успехами проекта «Тотальный диктант». Ежегодная образовательная акция привлекает все больше участников. В 2014 году диктант писали 64 тысячи человек в 352 городах мира. Ключевые составляющие успешного проекта — оригинальный текст (в этом году автором текста был Алексей Иванов), грамотный менеджмент и лингвистическое обеспечение на академическом уровне. Мы поговорили с председателем экспертной комиссии Тотального диктанта Натальей Борисовной Кошкарёвой — не только о диктанте.
...Интервью с Натальей Кошкарёвой, председателем экспертной...
...Портал «Грамота.ру» следит за успехами...
...При проверке «вручную» человек, конечно же, не обратил бы на это никакого внимания, а программа такую замену считала за две орфографические ошибки. Конечно, была предусмотрена система апелляций, мы ответили на тысячу запросов по результатам автоматизированной проверки....
...«На родной язык стараний не жалко»...