Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Наши представления о Древней Руси во многом сформированы «Повестью временных лет», которая не всегда может служить достоверным историческим источником. Споры о роли скандинавов в создании древнерусского государства продолжались веками. Недостаток источников создал почву для развития псевдоисторических идей и любительской лингвистики. Но того, что известно исследователям, достаточно, чтобы проследить судьбу важных русских корней рус- и рос-.
...Наши представления о Древней Руси во многом сформированы...
...Этимология: фантазии и факты Наверняка многие слышали...
В мире насчитываются тысячи языков, на которых говорят миллиарды людей. И тем не менее энтузиасты продолжают изобретать все новые искусственные языки разной степени проработанности — от пары фраз до полноценного словаря и грамматики. На какие группы делятся сконструированные языки — конланги — и для кого они предназначены?
...В мире насчитываются тысячи языков, на которых...
...Какие бывают конланги Одни конланги основаны на уже...
Совсем скоро выпускники будут сдавать ЕГЭ по русскому языку. Показывают ли результаты этого экзамена уровень знания предмета? Каких умений не хватает филологам-первокурсникам? Можно ли в школе научить не только грамотно писать, но и убедительно говорить? Об этом мы поговорили с экспертом Грамоты, кандидатом филологических наук, доцентом МПГУ Станиславом Викторовичем Ивановым.
...Совсем скоро выпускники будут сдавать ЕГЭ по русскому...
...Грамота: К вам приходят учиться люди, которые...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Необходимость заговорить с незнакомым человеком часто ставит нас в тупик. При всем желании найти вежливое, нейтральное, современное и уместное слово получается не всегда. «Товарищ» остался в СССР, «гражданин» звучит тревожно, «господин» режет слух, «женщину» и «мужчину» странно считать обращениями. Приходится признать, что в этом месте в русском языке есть проблема.
...Необходимость заговорить с незнакомым человеком...
...Раньше было проще Чтобы выбрать обращение, мы мгновенно...
5 апреля 2025 года в России и некоторых других странах пройдет Тотальный диктант. О том, как к нему подготовиться, рассказала лингвист, член Филологического совета Тотального диктанта Светлана Викторовна Друговейко-Должанская. А мы сопроводили ее рассказ примерами из диктантов разных лет, которые дают представление об уровне сложности этого испытания.
...5 апреля 2025 года в России и некоторых...
...Что такое Тотальный диктант Тотальный диктант ...
В статье рассматриваются проблемы теории и истории языкознания рубежа XIX–XX веков, получившие развитие в трудах видного лингвиста Дмитрия Николаевича Кудрявского (1867–1920). Автор обращает особое внимание на обзор научных идей, изложенных в новаторском курсе лекций «Введение в языковедение», их связь с новыми тенденциями в отечественной и мировой науке начала XX века и подчеркивает их значение для осмысления последующей лингвистической традиции в России. В статье приведены также малоизвестные факты сотрудничества Д. Н. Кудрявского с «Энциклопедическим словарем» Брокгауза и Ефрона.
...В статье рассматриваются проблемы теории и истории...
...Только постоянное нарушение живой речью устанавливаемых...
К языку средств массовой информации в последние годы читающей либо слушающей публикой и изучающими его специалистами-филологами предъявляются многочисленные и, увы, чаще всего вполне обоснованные претензии. Публику раздражает или шокирует, а специалистам кажется неоправданным или даже неприемлемым многое: и перенасыщение языка СМИ американизмами, и обилие в нем жаргонной, «блатной» и даже матерной лексики, и нарушение нормального темпа и нормативного интонационного рисунка речи.
...К языку средств массовой информации в последние годы...
...Кое-какие из этих претензий можно счесть, конечно,...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...