Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...
К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Принципы коммуникативной эффективности и основы права требуют, чтобы законы были понятны обывателям, однако эмпирические данные свидетельствуют о том, что юридические документы в основном непонятны как юристам, так и неспециалистам. Как известно, законы содержат поразительно высокий уровень сложных синтаксических структур по сравнению с другими жанрами текстов. В исследовании, опубликованном в PNAS, ученые из США, Великобритании и Австралии ...
...Принципы коммуникативной эффективности и основы...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
О жизни и научной работе российского лингвиста, члена-корреспондента АН СССР Дмитрия Ушакова рассказывает статья на портале «Полит.ру».
...О жизни и научной работе российского лингвиста, члена-корреспондента...
...Ушаков получил начальное образование дома, затем учился...
Технологии на базе искусственного интеллекта проникли в повседневную жизнь: мы узнаем у них о погоде, поручаем им рутинные задачи и даже обсуждаем с ними личные проблемы. У современного человека появился новый тип собеседника, который может быть и помощником, и источником эмоциональной поддержки. Насколько естественно для человека вступать в диалог с неживыми объектами?
...Технологии на базе искусственного интеллекта проникли...
...Ожившие силы природы С древних времен люди наделяли...
Дефис вместо тире часто ставят даже те, кто познал тайны «-тся/-ться» и знает кунфу расстановки запятых. Казалось бы, какая разница — чуть покороче палочка или чуть подлиннее? На самом деле разница есть. Более того, в этом вопросе есть и неочевидные тонкости, которые осложняют жизнь корректоров и иногда ставят в тупик пользователей Грамоты. Мы попробовали составить маленький путеводитель по простым и сложным случаям.
...Дефис вместо тире часто ставят даже те, кто познал...
...В чем разница Сначала посмотрим нашим героям в лицо...
Наша чувствительность к языкам — удивительная черта, которая позволяет нам быстро овладевать речью. Считается, что раннее освоение языка состоит из двух этапов. В ходе первого младенцы учатся отличать звуки родительского языка от посторонних звуков, другими словами, развивают чувствительность к звучанию именно того языка, на котором будут говорить. Этот процесс принято называть перцептивной настройкой (от perception — восприятие, схватывание). На втором этапе ребенок ...
...Наша чувствительность к языкам — удивительная...
Каким образом можно увидеть разницу в картине мира на конкретных языковых примерах? Журнал «Наука и жизнь» приводит интересные случаи такого рода в английском и русском языках.
...Каким образом можно увидеть разницу в картине мира...
...Грамматические и лексические особенности того языка...
Грамота решила не ограничиваться в 2024 году толкованием слова вайб и проделала аналогичную работу с теми словами, которые особенно часто появлялись в запросах наших пользователей. Это имена существительные маркетплейс, стендап, буллинг, худи, чекап, инфлюенсер, абьюз, абьюзер, вишлист, гойда, кипиш, кринж, а также имена собственные «Ютуб» и «Ватсап», которые получили широкое распространение и фактически употребляются как нарицательные. На примере пяти новых слов мы покажем, что у нас получилось.
...Грамота решила не ограничиваться в 2024 году толкованием...
...В лаборатории лексикографа В рамках проекта «...