НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
Новый номер доступен на сайте журнала. Напомним, что на сайте выложены в открытый доступ все номера журнала за 1967–2022 годы.
...Новый номер доступен на сайте журнала. Напомним, что...
...В новом номере: о вариантах русского ударения и...
В самом конце 2006 года, а затем несколькими тиражами в 2007 году опубликована книга «Правила русской орфографии и пунктуации. Полный академический справочник» (М.: Эксмо). Справочник издан под грифом Российской академии наук и одобрен Орфографической комиссией РАН.
...В самом конце 2006 года, а затем несколькими тиражами...
...Основная задача многолетней (с начала 90-х годов) работы...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Русский язык не ограничивается литературным вариантом. В русских деревнях можно услышать разные диалекты, которые сохранили древние черты. В двух выпусках подкаста (1, 2) «Глагольная группа», а также в интервью журналу «Системный Блокъ» лингвист-диалектолог, заместитель директора Института языкознания РАН Игорь Исаев рассказал о своем опыте участия в диалектологических экспедициях.
...Русский язык не ограничивается литературным вариантом...
...Родители Игоря Исаева говорили на разных диалектах:...
Банкаброшница — это не банковская работница, а работница, обслуживающая прядильную машину. Название профессии происходит от французского банкаброш (banc a broches, букв. «станок со спицами»). Это слово представлено в «Толковом словаре русского языка» под ред. Д. Н. Ушакова (1935–1940) как неологизм, технический термин. Толкуется оно так: ‘машина в бумагопрядильном производстве, разбивающая массу хлопкового волокна на отдельные, более ...
...Банкаброшница — это не банковская работница,...
Предлагаем вниманию читателей портала статью Павла Яковлевича Черных, опубликованную в журнале «Русский язык в школе» (№ 3, 1949). Правильно ли мы читаем и, главное, понимаем программное стихотворение А. С. Пушкина? Как в черновиках поэта выглядели знакомые нам со школьной скамьи строки? Об этом идет речь в статье.
...Предлагаем вниманию читателей портала статью Павла...
...Предисловие «Грамоты.ру» Павел Яковлевич...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...
Выбор слов может многое сказать о человеке — его воспитании, происхождении, окружении и особенностях мышления. В частности, речь может выявить укорененные гендерные стереотипы, как показала опубликованная недавно работа сотрудников Федеральной политехнической школы Лозанны. Авторы проанализировали 8 тысяч резюме и 25 тысяч рекомендательных писем, которые были представлены кандидатами на позиции ассистента (или аналогичную в академической среде) ...
...Выбор слов может многое сказать о человеке ...