НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Во время извержения Везувия в 79 году н. э. сотни свитков папируса в библиотеке роскошной виллы недалеко от Геркуланума (так называемой Виллы Папирусов) были погребены под слоем пепла и пемзы. Прежде исследователи полагали, что содержание наиболее пострадавших свитков утрачено навсегда. Но недавно с помощью цифровой реставрации удалось прочесть надпись на одном из них. Команда специалистов в области компьютерных наук из Университета Кентукки в марте 2023 года запустила конкурс Vesuvius ...
...Во время извержения Везувия в 79 году н. э. сотни свитков...
В новом разделе «Библиотека о Толстом» теперь есть возможность удобного поиска по свидетельствам современников Толстого и исследованиям толстоведов. Пока что в библиотеку включены записи трех важнейших свидетелей жизни Толстого: врача Душана Маковицкого, пианиста Александра Гольденвейзера и жены писателя Софьи Андреевны Толстой, — но коллекция свидетельств будет пополняться. Также у специалистов и любителей будет возможность ...
...В новом разделе «Библиотека о Толстом...
Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Недавнее исследование, проведенное учеными из ...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Попугаи наряду с людьми, китообразными и некоторыми певчими птицами обладают редким талантом — вокальным обучением. Они не рождаются с набором песен, а учат их, имитируя сородичей. Это делает их идеальной моделью для изучения того, как зарождаются элементы языка. Авторы недавней работы, опубликованной в Journal of Avian Biology, с этой целью проанализировали структуру «трелевых дуэтов» (warble duets) желтошейных амазонов.
...Попугаи наряду с людьми, китообразными и ...
Пять книг, которые мы выбрали, предназначены для широкого круга читателей. Они свидетельствуют об интересе к происхождению русского письма, который сохранялся на протяжении всего XX века. Из них вы узнаете, как возникли привычные нам буквы, чем кириллица отличается от глаголицы и при чем здесь греки и финикийцы.
...Пять книг, которые мы выбрали, предназначены для широкого...
...1. Елена Уханова. У истоков славянской письменности...
Зачем филологи отправляются в экспедиции и проводят полевые исследования в разных частях России? Что можно узнать о языке только «на местности»? Ведущая программы «Наблюдатель» Фекла Толстая пригласила обсудить результаты последнего полевого сезона диалектологов и фольклористов.
...Зачем филологи отправляются в экспедиции и ...
...В передаче участвовали: Андрей Мороз —...