Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
В ХМАО — Югре ведется работа по созданию цифровых корпусов хантыйского и мансийского языков. Об этом сообщает правительство региона по итогам рабочего совещания. Цифровые корпуса представляют собой масштабные текстовые базы данных, предназначенные для изучения и анализа структуры, лексики и грамматики языков коренных народов округа. В рамках государственной программы осуществляется параллельный перевод предложений с русского на мансийский язык, создание аудиозаписей речи, оцифровка ...
...В ХМАО — Югре ведется работа по созданию...
Первая основана на результатах диалектологической экспедиции во Владимирскую область, а вторая иллюстрирует на разных примерах такое языковое явление, как синтаксическая редупликация.
...Первая основана на результатах диалектологической экспедиции...
...Муромское ёканье Примеры, которые собрали лингвисты...
Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...
...Системы распознавания речи работают с последовательностью...
Русское ударение — сложнейшая система, которая ставит в тупик иностранцев. Вот что о ней говорит сам Александр Пиперски, лауреат премии «Просветитель»: «Если вы говорите красиве́е, вас обвинят в необразованности. Если вы говорите осу́жденный, вы, вероятно, работаете в прокуратуре. Если вы ловко ставите ударение то на окончание, то на корень, то на предлог, говоря рука́, ру́ку и за́ руку, вы, скорее всего, носитель русского языка и даже не задумываетесь об этом — а ...
...Русское ударение — сложнейшая система, которая...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Восьмое марта — противоречивый праздник: начался он с борьбы за равноправие женщин, а продолжается под пожелания «быть мужу воздухом весенним, быть летним солнцем для детей». Рассказать о том, как обстоят дела с неравноправием в языке, и выбрать подходящие поздравления с Женским днем, Грамоте помог Валерий Ефремов — доктор филологических наук, заведующий кафедрой русского языка филологического факультета РГПУ им. А. И. Герцена, соведущий программы «Как это по-русски» на «Радио России Петербург».
...Восьмое марта — противоречивый праздник:...
...Поэтка и блогерка против мастера маникюра Главные...
Всё чаще можно слышать, что большие языковые модели вроде ChatGPT «пишут как люди». На первый взгляд их способность имитировать нашу речь действительно потрясает. Но более пристальный научный анализ все же выявляет различия. Научная группа из Университета Карнеги — Меллона (США) проверила с помощью методов корпусного анализа, насколько созданные человеком тексты отличаются от текстов в тех же жанрах и стилях, но созданных языковыми моделями (LLM).
...Всё чаще можно слышать, что большие языковые модели...
За два века слово может изменить свое значение до неузнаваемости. Многие слова, которыми мы пользуемся сегодня, совершенно иначе воспринимались нашими предками, пишет «Системный Блокъ». Тест на лингвистическую интуицию: сможете ли вы догадаться, когда возникла поговорка «голод не тетка», а слово «молодец» стало похвалой?
...За два века слово может изменить свое значение до неузнаваемости...
...Любой язык со временем меняется. Даже слова, которые...
В ответ на запрос издания «Лента.ру» Роскомнадзор заявил, что список слов, запрещенных к использованию в СМИ, не изменился после выхода «Толкового словаря государственного языка Российской Федерации». В этом издании в словарной статье лексемы «нецензурный» (часть 1, с. 388) перечислены 14 корней: как хорошо известные матерные, так и те, которые раньше не были под запретом. Словарь утверждает, что ...
...В ответ на запрос издания «Лента.ру...