27 июня в международном мультимедийном пресс-центре «Россия сегодня» состоялась пресс-конференция Института русского языка Российского университета дружбы народов. Об уникальных образовательных программах бакалавриата «Прикладная цифровая филология» и магистратуры «Цифровые инновации в филологии» рассказали участники пресс-конференции: — директор Института русского языка РУДН, член Совета при Президенте Российской Федерации по русскому ...
...27 июня в международном мультимедийном пресс-центре...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
В Год семьи Российский книжный союз совместно с Русской школьной библиотечной ассоциацией запустил проект «Читающая мама», направленный на популяризацию традиций семейного чтения. Родителей призывают уделять этому занятию хотя бы десять минут в день. Авторы перечисляют те задачи, которые можно решить благодаря регулярному чтению детям; в их числе — развитие речи, развитие навыков чтения и воображения, формирование эмоционального ...
...В Год семьи Российский книжный союз совместно с ...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Разделы книги отражают многообразные интересы автора: японистика, теория языка и типология, языковая политика и социолингвистика, а также история языкознания. Книга доступна для скачивания в формате pdf.
...Разделы книги отражают многообразные интересы автора...
...Отдельно отметим раздел «Лингвистические задачи...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Диалектный корпус позволяет ставить и решать новые...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...