Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Пока что в нем около 6 млн словоупотреблений...
...Корпус размещен по адресу: http://udmcorpus.udman.ru/...
... Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений....
...Роспатент выдал свидетельство о регистрации Национального...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...Поздравляем наших партнеров и рассказываем об их успехах...
...Корпус может быть полезен и лингвистам, и преподавателям русского языка, и другим пользователям для разных нужд....
...НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка....
...Кому и зачем нужен Национальный корпус русского языкаПолучить всю картотеку одним кликом и другие, менее очевидные возможности специальных корпусовСовокупные ресурсы и инструменты Национального корпуса русского языка, цифровой экосистемы «Грамота» и будущего Национального словарного...
...Национальному корпусу русского языка исполняется 20...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Инструменты, разработанные сотрудниками ИЛИ РАН, будут...
...Благодя цифровизации науки многие полезные справочные...
... Corpus latino-rossicum Это параллельный корпус латинско-русских текстов, снабженный разметкой. Он основан на классических переводах текстов с латыни на русский язык (Михаила Гаспарова, Якова Боровского, Аристида Доватура и других)....
...Современные онлайн-ресурсы расширяют возможности исследователей...
Люди давно поняли, что записывать слова от руки — слишком трудоемкий процесс. Чтобы быстро делиться большими объемами информации, нужно было этот процесс упростить и ускорить. И вот примерно полтора века назад решение было найдено. С тех пор человечество стучит по клавишам.
...Стук клавиш становится все тише, а скорость печати...
...Люди давно поняли, что записывать слова от руки &mdash...
... Тогда же функциональные элементы компьютера переехали в корпус, а клавиатура с 83 клавишами стала устройством ввода данных. Кнопок Caps Lock и Num Lock еще не было, неудобные функциональные клавиши выглядели так же, как буквенные. Клавиши Delete и Backspace дали людям право на ошибку....
...Всемирная история клавиатур: от букв вместо цифр до...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Получить всю картотеку одним кликом и другие, менее...
...Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений....
...К основному набору корпусов добавились многие новые, в том числе в последние годы — корпус русской классики, детский корпус («От 2 до 15») и корпус социальных сетей....
... Если бы мы в основной корпус загрузили все собрания сочинений, этот огромный массив перевесил бы все остальное; мы получили бы не корпус русского языка, а корпус языка писателей-классиков.Анастасия Козеренко В основной корпус включены только некоторые тексты разных авторов, а в корпусе...
...Сейчас в параллельном корпусе представлены мультиязычный корпус и 25 языковых пар, и их число постоянно растет. Предположим, вы выбрали тексты, которые хотите включить в корпус. Что дальше? А. К.: Все тексты, которые мы включаем в корпус, специальным образом размечаются....
...И почему нельзя все тексты объединить в один корпус? И. В.: У корпуса есть продуктовый комитет, который решает, в какую сторону мы будем развивать корпус и что хотим в него добавить....
...Поэтому, в частности, было решено выделить русскую классику в отдельный корпус....
...Кому и зачем нужен Национальный корпус русского языка...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...Мероприятие организовано Домом народов России при поддержке...
...В современном мире, чтобы язык сохранялся и ...
... Тексты, попадающие в корпус, проходят оцифровку, вычитку, токенизацию (разбивку на слова), нейроразметку морфологии и синтаксиса, морфологический анализ, разметку семантики и в самом конце объединение модели и индексацию....
... Для внедрения в онлайн-переводчик нового языка нужны данные, прежде всего параллельные корпусы: чем больше корпус параллельных предложений, тем выше качество перевода. Для среднего корпуса нужно хотя бы 600–700 тыс. предложений....
...В Москве прошла первая стратегическая сессия «Информационные...
Конгресс приурочен к Году педагога и наставника в России и станет главным событием IV съезда Общества русской словесности. 9 ноября состоится пленарное заседание и награждение победителей Международного конкурса «Учитель и его ученики на пространстве СНГ», посвященного двухсотлетию со дня рождения Константина Ушинского и Году русского языка как языка межнационального общения в СНГ. На 10–11 ноября намечены основные мероприятия конгресса, в том числе: Съезд учителей и ...
...В нем участвуют не только преподаватели русской словесности...
...лингвистические теории в обучении русскому языку, искусственный интеллект и большие языковые модели, лингвистические корпусы, базы данных и другие ресурсы цифровой среды в изучении иностранных языков, цифровые научные проекты в изучении, преподавании и популяризации родных языков и литератур, национальный корпус...
...Международный педагогический конгресс пройдет 9–10...
Русское ударение — сложнейшая система, которая ставит в тупик иностранцев. Вот что о ней говорит сам Александр Пиперски, лауреат премии «Просветитель»: «Если вы говорите красиве́е, вас обвинят в необразованности. Если вы говорите осу́жденный, вы, вероятно, работаете в прокуратуре. Если вы ловко ставите ударение то на окончание, то на корень, то на предлог, говоря рука́, ру́ку и за́ руку, вы, скорее всего, носитель русского языка и даже не задумываетесь об этом — а ...
...Вырученные средства пойдут фонду, который помогает...
...На онлайн-лекции будут затронуты следующие вопросы: как ударение различает людей в обществе; как вышло, что древнерусская система постановки ударения была простой и логичной, а в современном русском языке все стало гораздо сложнее; что может рассказать об ударении электронный корпус русской поэзии...
...28 ноября лингвист Александр Пиперски прочтет благотворительную...
Авторская, или писательская, лексикография может быть определена в целом как теория и практика создания словарей языка отдельных авторов. Теория авторской лексикографии охватывает широкий круг проблем: это определение статуса, объема, содержания данного научного направления, прагматической специфики авторских словарей, выявление макро- и микроструктуры таких справочников, их объяснительного аппарата, системно-типологической организации. Сюда же относятся и вопросы истории авторской лексикографии.
...Словари языка писателей и других авторов можно классифицировать...
...Авторская, или писательская, лексикография может быть...
...Основной корпус словаря дополняется частотным словарем. Главная его функция — служить фоном для словаря тропов, поэтому частотный словарь фиксирует словоформы (а не слова) и строится по алфавитному принципу....
...Авторская лексикография в отечественном языкознании...
На первый взгляд теоретические вызовы, стоящие перед современной лингвистической наукой, бесконечно далеки от проблем школьного русского. Но если предложить школьникам задуматься над почему-вопросами об устройстве языка, это расширит их научную картину мира и сделает освоение родного языка более увлекательным, считает доктор филологических наук, заведующий кафедрой теоретической и прикладной лингвистики филологического факультета МГУ Сергей Георгиевич Татевосов.
...Доклад лингвиста Сергея Татевосова на Международном...
...На первый взгляд теоретические вызовы, стоящие перед...
...Владимир Плунгян: «Первый урок корпуса — не злоупотреблять нормализаторством»Корпус учит лингвистов не доверять своей интуиции и изучать те явления, которые встречаются частоЗдесь возникает важная развилка, и у современных лингвистов-теоретиков на данный момент нет согласия...
...Что лингвистическая теория может дать школьному образованию...