Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
... Корпус представляет собой информационно-справочную...
...Корпус размещен по адресу: http://udmcorpus.udman.ru...
О начале работы над корпусом объявили участники круглого стола, прошедшего в Тувинском институте гуманитарных и прикладных социально-экономических исследований (ТИГПИ) 22 июня. Круглый стол был посвящен 95-летию тувинской письменности и проводился в рамках Международного десятилетия языков коренных народов под эгидой ЮНЕСКО. Новый корпус будет насчитывать более 20 млн словоупотреблений, в том числе из газетного корпуса (около 10 млн), параллельного ...
... Новый корпус будет насчитывать более 20 ...
...будет реализован с опорой на Электронный корпус...
В ХМАО — Югре ведется работа по созданию цифровых корпусов хантыйского и мансийского языков. Об этом сообщает правительство региона по итогам рабочего совещания. Цифровые корпуса представляют собой масштабные текстовые базы данных, предназначенные для изучения и анализа структуры, лексики и грамматики языков коренных народов округа. В рамках государственной программы осуществляется параллельный перевод предложений с русского на мансийский язык, создание аудиозаписей речи, оцифровка ...
...В конце 2024 года корпус мансийского языка, содержащий...
...Одновременно формируется корпус хантыйского языка &...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
...Корпус может быть полезен и лингвистам, и ...
Всё чаще можно слышать, что большие языковые модели вроде ChatGPT «пишут как люди». На первый взгляд их способность имитировать нашу речь действительно потрясает. Но более пристальный научный анализ все же выявляет различия. Научная группа из Университета Карнеги — Меллона (США) проверила с помощью методов корпусного анализа, насколько созданные человеком тексты отличаются от текстов в тех же жанрах и стилях, но созданных языковыми моделями (LLM).
...были сформированы два корпуса текстов: параллельный корпус...
...ходе первого этапа эксперимента текстов, и большой корпус...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...данные, прежде всего параллельные корпусы: чем больше корпус...
... Тексты, попадающие в корпус, проходят...
Каждый год специалисты фиксируют, что происходит с языком: какие слова становятся популярными, как меняется норма, каким образом влияют на язык новые законодательные инициативы. Всю правду о том, как жилось русскому языку в уходящем году, раскроет научный руководитель Грамоты, а также председатель филологического совета Тотального диктанта, научный сотрудник Института русского языка им. В. В. Виноградова РАН и ведущий подкаста «Розенталь и Гильденстерн» Владимир Пахомов. Лекция ...
...Черкизовская, дом 4, корпус 1....
На примере проекта Chekhov Digital онлайн-журнал «Системный Блокъ» рассказывает о семантическом издании и о том, чем оно полезно.
...На примере проекта Chekhov Digital онлайн-журнал...
...Корпус таких TEI-документов представляет труды писателя...
«Наверно, что-то сменится в жизни твоей и моей» — так (цитатой из песни) называется лекция, которую можно будет послушать 20 декабря в 18:00 в Российской государственной библиотеке молодежи. Традиционная предновогодняя лекция будет посвящена словам, которые привлекли внимание в уходящем году, обновлениям словарей, новинкам в области книг о языке и другим лингвистическим итогам года. Ее прочтет Владимир Пахомов —
... Черкизовская, дом 4, корпус 1, конференц-зал...
Русское ударение — сложнейшая система, которая ставит в тупик иностранцев. Вот что о ней говорит сам Александр Пиперски, лауреат премии «Просветитель»: «Если вы говорите красиве́е, вас обвинят в необразованности. Если вы говорите осу́жденный, вы, вероятно, работаете в прокуратуре. Если вы ловко ставите ударение то на окончание, то на корень, то на предлог, говоря рука́, ру́ку и за́ руку, вы, скорее всего, носитель русского языка и даже не задумываетесь об этом — а ...
...сложнее; что может рассказать об ударении электронный корпус...