Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Исследователи из Гуманитарного института и Института Севера и Арктики Сибирского федерального университета (СФУ) совместно с Восточно-Сибирской нефтегазовой компанией (дочерним предприятием «Роснефти») создали онлайн-курс по изучению эвенкийского языка и культуры. Об этом сообщает «АиФ Красноярск». В курсе предусмотрено 18 модулей, которые включают занятия по языку, литературе, искусству и истории народа. Программа разработана специально ...
...Исследователи из Гуманитарного института и Института...
В марте справочная служба ответила на десятки вопросов о запятых, мы их внимательно изучили, но так и не смогли выбрать самый интересный. Зато мы хотим поговорить о том, откуда в сервизе появилась лишняя посуда, почему у однокоренных слов корни бывают разной длины и как наши привычные жесты можно описать с помощью языка.
...В марте справочная служба ответила на десятки...
...Состав слова Вопрос: Помогите понять, почему в ...
Предлагаем вниманию читателей портала статью Александра Реформатского, опубликованную в журнале «Русский язык в школе» (№ 1, 1937). Из этой статьи читатель узнает, как в первые десятилетия советской власти шла работа по подготовке общеобязательного свода правил русского правописания, который, напомним, был официально утвержден только в 1956 году, почти через двадцать лет после написания статьи (работа по упорядочению правописания прервалась в годы Великой Отечественной войны).
...Предлагаем вниманию читателей портала статью Александра...
...Предисловие «Грамоты.ру» Александр Александрович...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Происхождение индоевропейских языков остается дискуссионным вопросом уже больше двухсот лет. К настоящему времени сложились две основные гипотезы: «степная», которая ищет истоки языковой семьи в понтийско-каспийской степи около шести тысяч лет назад, и «земледельческая», предполагающая более древнее происхождение, связанное с ранним земледелием около девяти тысяч лет назад. Новый вклад в эту дискуссию внесли исследователи из Отдела лингвистической и культурной эволюции ...
...Происхождение индоевропейских языков остается дискуссионным...
В Якутии помимо русского и якутского распространены языки коренных малочисленных народов Севера, такие как эвенкийский, эвенский, юкагирский, долганский и чукотский. Недавно Центр языка и мозга НИУ ВШЭ объявил о партнерстве с Академией наук Республики Саха (Якутия), которое предполагает изучение этих языков с акцентом на когнитивные процессы. Среди прочего специалистов интересует, как дети и взрослые осваивают и используют разные языки, какие факторы влияют на выбор языка в ...
...В Якутии помимо русского и якутского распространены...
Все мы слышали эти слова, но понимаем ли, что они в точности значат? Или каждый раз забываем, как их использовать? Длинные слова с туманным, абстрактным смыслом звучат умно и солидно. Но именно их лучше не писать и не говорить, если не уверены на все сто: вместо того, чтобы блеснуть эрудицией, можно попасть впросак. Рассказываем, как правильно их использовать и какие ошибочные употребления встречаются чаще всего.
...Все мы слышали эти слова, но понимаем ли, что они в...
...1. Амбивалентный Значение: двойственный, противоречивый...
За прошедшие два десятилетия НКРЯ стал незаменимым инструментом для лингвистов, преподавателей, студентов и всех, кто интересуется русским языком. Усилия команды специалистов в области языка, а также разработчиков цифровой платформы НКРЯ позволили собрать обширную базу данных, отражающую богатство и разнообразие русского языка. На сайте корпуса постоянно публикуется информация о пополнении старых частей корпуса, о создании новых корпусов внутри НКРЯ и о
...За прошедшие два десятилетия НКРЯ стал незаменимым...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...