В конференции участвовали лингвисты, лексикографы, руководители электронных библиотек. Вела конференцию член редакционного совета «Грамоты.ру» Юлия Сафонова.
...В конференции участвовали лингвисты, лексикографы,...
...Собственно, что такое корпус?...
...Национальный корпус — один из них....
...и доступный корпус в интернете....
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
... Корпус представляет собой информационно-справочную...
...Корпус размещен по адресу: http://udmcorpus.udman.ru...
О начале работы над корпусом объявили участники круглого стола, прошедшего в Тувинском институте гуманитарных и прикладных социально-экономических исследований (ТИГПИ) 22 июня. Круглый стол был посвящен 95-летию тувинской письменности и проводился в рамках Международного десятилетия языков коренных народов под эгидой ЮНЕСКО. Новый корпус будет насчитывать более 20 млн словоупотреблений, в том числе из газетного корпуса (около 10 млн), параллельного ...
... Новый корпус будет насчитывать более 20 ...
...будет реализован с опорой на Электронный корпус...
В ХМАО — Югре ведется работа по созданию цифровых корпусов хантыйского и мансийского языков. Об этом сообщает правительство региона по итогам рабочего совещания. Цифровые корпуса представляют собой масштабные текстовые базы данных, предназначенные для изучения и анализа структуры, лексики и грамматики языков коренных народов округа. В рамках государственной программы осуществляется параллельный перевод предложений с русского на мансийский язык, создание аудиозаписей речи, оцифровка ...
...В конце 2024 года корпус мансийского языка, содержащий...
...Одновременно формируется корпус хантыйского языка &...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
...Корпус может быть полезен и лингвистам, и ...
Всё чаще можно слышать, что большие языковые модели вроде ChatGPT «пишут как люди». На первый взгляд их способность имитировать нашу речь действительно потрясает. Но более пристальный научный анализ все же выявляет различия. Научная группа из Университета Карнеги — Меллона (США) проверила с помощью методов корпусного анализа, насколько созданные человеком тексты отличаются от текстов в тех же жанрах и стилях, но созданных языковыми моделями (LLM).
...были сформированы два корпуса текстов: параллельный корпус...
...ходе первого этапа эксперимента текстов, и большой корпус...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...данные, прежде всего параллельные корпусы: чем больше корпус...
... Тексты, попадающие в корпус, проходят...
На примере проекта Chekhov Digital онлайн-журнал «Системный Блокъ» рассказывает о семантическом издании и о том, чем оно полезно.
...На примере проекта Chekhov Digital онлайн-журнал...
...Корпус таких TEI-документов представляет труды писателя...
Каждый год специалисты фиксируют, что происходит с языком: какие слова становятся популярными, как меняется норма, каким образом влияют на язык новые законодательные инициативы. Всю правду о том, как жилось русскому языку в уходящем году, раскроет научный руководитель Грамоты, а также председатель филологического совета Тотального диктанта, научный сотрудник Института русского языка им. В. В. Виноградова РАН и ведущий подкаста «Розенталь и Гильденстерн» Владимир Пахомов. Лекция ...
...Черкизовская, дом 4, корпус 1....
Что известно о новых нормативных словарях русского как государственного? Изменится ли ударение в слове звонит? Появились ли новые законодательные ограничения на нецензурную брань? На эти и другие вопросы можно будет получить ответы на лекции «Лингвистические итоги 2025 года», которая пройдет 18 декабря в 19:00 в конференц-зале Российской государственной библиотеки молодежи. Лекцию прочтет Владимир Пахомов — кандидат ...
...Адрес: Москва, Большая Черкизовская улица, дом 4, корпус...