НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Во время извержения Везувия в 79 году н. э. сотни свитков папируса в библиотеке роскошной виллы недалеко от Геркуланума (так называемой Виллы Папирусов) были погребены под слоем пепла и пемзы. Прежде исследователи полагали, что содержание наиболее пострадавших свитков утрачено навсегда. Но недавно с помощью цифровой реставрации удалось прочесть надпись на одном из них. Команда специалистов в области компьютерных наук из Университета Кентукки в марте 2023 года запустила конкурс Vesuvius ...
...Во время извержения Везувия в 79 году н. э. сотни свитков...
В новом разделе «Библиотека о Толстом» теперь есть возможность удобного поиска по свидетельствам современников Толстого и исследованиям толстоведов. Пока что в библиотеку включены записи трех важнейших свидетелей жизни Толстого: врача Душана Маковицкого, пианиста Александра Гольденвейзера и жены писателя Софьи Андреевны Толстой, — но коллекция свидетельств будет пополняться. Также у специалистов и любителей будет возможность ...
...В новом разделе «Библиотека о Толстом...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Попугаи наряду с людьми, китообразными и некоторыми певчими птицами обладают редким талантом — вокальным обучением. Они не рождаются с набором песен, а учат их, имитируя сородичей. Это делает их идеальной моделью для изучения того, как зарождаются элементы языка. Авторы недавней работы, опубликованной в Journal of Avian Biology, с этой целью проанализировали структуру «трелевых дуэтов» (warble duets) желтошейных амазонов.
...Попугаи наряду с людьми, китообразными и ...
В России стартовал проект по созданию онлайн-переводчика для языков народов страны. Об этом сообщил руководитель Федерального агентства по делам национальностей (ФАДН) Игорь Баринов. Языкам народов России необходимо обеспечить полноценное функционирование в современном мире, заявил Баринов в выступлении на Восточном экономическом форуме. Он подчеркнул, что дискриминация по языковому признаку — в том числе цифровая — недопустима. Глава ФАДН перечислил комплекс мер, необходимых ...
...В России стартовал проект по созданию онлайн-переводчика...
Сегодня миллионы книг могут быть доступны нам в три клика. Нынешнее поколение школьников и студентов выросло с гаджетами в руках и с детства привыкло читать с экранов, что не могло не заинтересовать исследователей. Собранные данные говорят о том, что изменение носителя информации влияет на понимание и усвоение прочитанного. Вопрос в том, как именно влияет.
...Сегодня миллионы книг могут быть доступны нам в ...
...Чтение как неестественный процесс Многие исследования...
Индская, или Хараппская, цивилизация — одно из древнейших городских обществ в мире, возникшее около 5,3 тыс. лет назад на территории современной северо-западной Индии и Пакистана. С момента ее открытия прошло сто лет, но изучение ее особенностей затруднено из-за того, что мы пока не знаем ее языка. В книге индолога Грегори Посселя перечислены 60 важнейших попыток дешифровки, и среди них нет двух, которые были бы согласны друг с другом в трактовке значения символов.
...Индская, или Хараппская, цивилизация — одно из...