В 2028 году Россия и мир будут отмечать двухсотлетие со дня рождения Льва Толстого. Цифровая эпоха, в которую мы живем, дает возможность посмотреть на его жизнь и наследие как на уникальную базу данных. Прочитать забытое и малоизвестное, присмотреться к языку, сопоставить источники, лучше понять его идеи и контекст, в котором они возникли. Руководитель группы Tolstoy Digital Фекла Толстая рассказала Грамоте о проекте «Слово Толстого», в котором соединились ее увлечение цифровыми методами в гуманитарных науках и интерес к семейной истории.
...В 2028 году Россия и мир будут отмечать...
...Фекла Толстая: «Мы можем создать не 3D, а 10D-картинку...
...Грамота: Как возникла идея перевести Толстого в ...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...Национальному корпусу русского языка исполняется 20...
...НКРЯ — представительный корпус текстов на...
В издательстве «Дискурс» вышла монография двух докторов филологических наук Максима Кронгауза и Марии Ковшовой «Смех не без причины», посвященная разным жанрам сетевой поэзии, таким как, например, пирожки, порошки и депрессяшки, и языковым механизмам, которые заставляют читателя смеяться.
...В издательстве «Дискурс» вышла монография...
...Смех не без причины: лингвисты изучили языковые особенности...
...В центре внимания авторов текста —...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Портрет слова, корпус соцсетей и поиск коллокаций:...
...Национальный корпус русского языка — это огромная...
Сложно организованные сообщества требуют сложных систем коммуникации. Хотя многие животные выработали свои способы обмена информацией, можно ли сказать, что хоть один из видов приблизился в этом к людям? Исследователи из Лаборатории искусственного интеллекта Массачусетского технологического института и международной инициативы CETI изучили вокализации (звуковые сигналы) кашалотов и пришли к выводу, что они похожи на настоящий язык. Авторы работы отталкивались от ...
...Искусственный интеллект помог создать фонетический...
...Сложно организованные сообщества требуют сложных систем...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Кому и зачем нужен Национальный корпус русского языка...
...Грамота: С какими целями создавался корпус? А. К.:...
В России бок о бок с русскими столетиями живут другие коренные народы. Неизбежное в такой ситуации культурное взаимовлияние отразилось и на языке. Известно, что такие слова, как «казна», «деньги», «таможня» и многие другие, имеют тюркское происхождение и связаны с ордынским владычеством. А какие заимствованные из русского языка слова вошли в языки народов России? Для примера возьмем якутский, татарский, чеченский и коми-пермяцкий языки.
...В России бок о бок с русскими столетиями живут другие...
...Заимствования из русского в языках народов России...
...Русский язык, будучи государственным, не мог не повлиять...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...В Москве прошла первая стратегическая сессия «Информационные...
...Александр Антонов, руководитель группы оценки качества...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Новый подход поможет людям более успешно общаться с...
...Большие языковые модели — подобные тем,...
На портале Федерального института оценки качества образования опубликован отчет о результатах общероссийской оценки качества общего образования по модели международных сопоставительных исследований качества образования за 2023 год. Такая оценка проводится в России ежегодно с 2019 года. В этот раз результаты (в общероссийской и региональных выборках) основаны на анкетировании 61,5 тыс. обучающихся, сотен администраций образовательных ...
...Опубликованы российские результаты оценки функциональной...
...На портале Федерального института оценки качества образования...