НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Сколько слов существует в русском языке? Ответ на этот вопрос и сложен, и прост. Трудно назвать точную цифру, и на это есть несколько причин: язык постоянно развивается, обновляется (одни слова появляются в речи, другие исчезают, уходят); масса диалектных слов пока учеными просто не зафиксирована и ни в каких словарях не описана; почти все профессии и научные дисциплины обладают «собственными» лексиконами, которые не входят в общенародную литературную речь; есть и другие причины.
...Сколько слов существует в русском языке? Ответ на этот...
...Мир слов воистину огромен, безбрежен. Лексическое ядро...
«Заметки на полях» — совместный проект Тотального диктанта и сервиса МТС «Строки». Научный руководитель Грамоты Владимир Пахомов ведет его вместе с писательницей Ириной Лейк. В первом выпуске ведущие обсудили интересные слова и выражения — как модные и современные, так и из лексикона Льва Толстого.
...«Заметки на полях» — совместный проект...
...Ведущие вспомнили школьные годы, когда они впервые...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов обсуждают, как правильно ставить ударение в слове «догмат», причем Владимир делает шокирующее признание — оказывается в этом слове делал устойчивую ошибку даже он.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Какие английские слова и словосочетания стали лидерами по итогам голосования, рассказывает сайт «Годлитературы.рф».
...Какие английские слова и словосочетания стали лидерами...
...Слово года в этот раз впервые определили пользователи...
21 ноября Грамота представила список претендентов на звание «слова года». В него вошли слова, активно используемые в речи и вызывающие интерес у широкой аудитории: инсайт, вайб, нарратив, абьюз, аскеза, осознанность, прилёт, пов, сап, скуф и нормис. Первоначальный список из 120 слов был сформирован на основе опросов на сайте и в социальных сетях Грамоты, а также анализа текстов СМИ и других источников. Партнером проекта ...
...21 ноября Грамота представила список претендентов...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Я точно помню дату, когда чаша моего, так сказать, филологического терпения переполнилась: это произошло 23 декабря 1992 года. Утром я услышал из уст диктора российского радио примерно следующее: «Но основная выгода власть предержащих — это отсутствие свободы слова, гласности». А вечером того же дня симпатичный ведущий «Вестей» с обаятельной улыбкой заявил с телеэкрана: «Впрочем, баланс интересов прессы и власть предержащих возможен».
...Я точно помню дату, когда чаша моего, так сказать,...
...Я вспомнил, сколько раз за последнее время приходилось...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Проект «Слово Толстого» — цифровой...