НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Китайская технологическая корпорация Baidu недавно подала патентную заявку на ИИ-технологию, способную распознавать звуки животных и интерпретировать их. Об этом сообщает газета South China Morning Post. Разрабатываемая система, согласно заявке, собирает данные о голосе, движениях, поведении и других биосигналах животного, определяет их значение и преобразует в сообщения на человеческом языке. В основе технологии лежит машинное обучение и методы обработки естественного языка.
...Китайская технологическая корпорация Baidu недавно...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Во время извержения Везувия в 79 году н. э. сотни свитков папируса в библиотеке роскошной виллы недалеко от Геркуланума (так называемой Виллы Папирусов) были погребены под слоем пепла и пемзы. Прежде исследователи полагали, что содержание наиболее пострадавших свитков утрачено навсегда. Но недавно с помощью цифровой реставрации удалось прочесть надпись на одном из них. Команда специалистов в области компьютерных наук из Университета Кентукки в марте 2023 года запустила конкурс Vesuvius ...
...Во время извержения Везувия в 79 году н. э. сотни свитков...
В новом разделе «Библиотека о Толстом» теперь есть возможность удобного поиска по свидетельствам современников Толстого и исследованиям толстоведов. Пока что в библиотеку включены записи трех важнейших свидетелей жизни Толстого: врача Душана Маковицкого, пианиста Александра Гольденвейзера и жены писателя Софьи Андреевны Толстой, — но коллекция свидетельств будет пополняться. Также у специалистов и любителей будет возможность ...
...В новом разделе «Библиотека о Толстом...
На самом деле этот подкаст — не совсем о русском языке. Девятнадцать коротких выпусков — это истории о том, каким путем в русский язык попали разные непонятные слова и что они означают. Несмотря на некоторые лингвистические неточности, эти увлекательные истории расширяют наше понимание современной речи. Чтобы дать представление о содержании подкаста, опишем вкратце содержание двух выпусков.
...На самом деле этот подкаст — не совсем о...
...Тема первого выпуска — англицизмы,...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Сразу несколько представителей профильных ведомств в последние дни призвали ужесточить требования к тому уровню, на котором мигранты владеют русским языком. В частности, об этом заявил на пресс-конференции 24 июня заместитель руководителя Федерального агентства по делам национальностей Станислав Бедкин. А спустя три дня на эту тему высказался руководитель Федеральной службы по надзору в сфере образования и науки (Рособрнадзора) Анзор Музаев в ходе ...
...Сразу несколько представителей профильных ведомств...
Индская, или Хараппская, цивилизация — одно из древнейших городских обществ в мире, возникшее около 5,3 тыс. лет назад на территории современной северо-западной Индии и Пакистана. С момента ее открытия прошло сто лет, но изучение ее особенностей затруднено из-за того, что мы пока не знаем ее языка. В книге индолога Грегори Посселя перечислены 60 важнейших попыток дешифровки, и среди них нет двух, которые были бы согласны друг с другом в трактовке значения символов.
...Индская, или Хараппская, цивилизация — одно из...