За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».
...За двадцать лет Национальный корпус русского языка...
...Первые корпусы появились в 1960-х годах, но тогда...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...
Орфографическая чувствительность — одно из уникальных человеческих свойств, связанное с восприятием письменной речи. Эта способность позволяет отличать не только слова от случайных наборов букв, но и правильно написанные слова от слов с ошибками. Чувствительность к орфографическому облику слова начинает формироваться обычно в младшем школьном возрасте, когда дети осваивают письмо. А в каком возрасте реакция на ошибки доводится до автоматизма? Это ...
...Орфографическая чувствительность — одно...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Ведущая программы «Наблюдатель» Фекла Толстая пригласила представителей близкой ей филологии, членов-корреспондентов РАН Елену Березович и Ирму Муллонен, академиков Алексея Гиппиуса и Николая Казанского, чтобы расспросить об их научных интересах и состоянии академической науки в России. Встреча была приурочена к трехсотлетию Российской академии наук, которое отмечается в этом году.
...Ведущая программы «Наблюдатель» Фекла Толстая...
...По мнению профессора Уральского федерального университета...
Перед вами третье задание конкурса, в котором есть задачки попроще и посложнее.
...Перед вами третье задание конкурса, в котором есть...
...Задания попроще 1. Буквомешалки Смешав и переставив...
Центр международного сотрудничества Министерства просвещения России объявил о старте международного конкурса «Лучшая русская школа за рубежом». Об этом сообщил в конце сентября телеграм-канал Ассоциации русских школ за рубежом «Мир образования». К участию приглашают учебные заведения и преподавателей русского языка и других дисциплин на русском языке, работающих в системе общего и дополнительного образования. Цель проекта — поддержка педагогов и коллективов ...
...Центр международного сотрудничества Министерства просвещения...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Проект «Слово Толстого» — цифровой...
В последнее время устаревшая церковнославянская и конфессиональная лексика активно используются современными массмедиа. Рассчитанные на массового читателя и слушателя, современные массово-коммуникативные тексты, воспроизводя стандартные языковые модели, обращаются к устаревшей лексике для большей эмоциональности, экспрессивности.
...В последнее время устаревшая церковнославянская и конфессиональная...
...Исследователь проблем современного русского языка Е...