Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...
Журнал «Наука и жизнь» проводит конкурс «Игры со словами». Перед вами третье задание конкурса, автор которого — кандидат филологических наук Илья Иткин. Итоги конкурса будут подведены в конце года. Победителей ждут призы от редакции журнала и ведущего игры Сергея Федина.
...Журнал «Наука и жизнь» проводит конкурс...
...На олимпиаде по лингвистике и математике, состоявшейся...
Законопроект был внесен на рассмотрение парламента в январе 2024 года. 9 апреля его приняли во втором и третьем чтениях. Новый федеральный закон вносит дополнения в закон «О государственном языке РФ», а именно дополняет его статьей 4, регламентирующей работу новой государственной информационной системы «Национальный словарный фонд». В ней будут представлены данные о современных и исторических нормах русского ...
...Законопроект был внесен на рассмотрение парламента...
В нашем обществе существует множество мифологических представлений о русском языке и его истории. Это связано с особенностями современного медиапространства: с одной стороны, информация о языке нередко искажается в СМИ; с другой стороны, широкие возможности для построения ошибочных теорий и их распространения предоставляет интернет. Нелингвисты, как правило, не всегда понимают, в чем разница между языком и правописанием, что такое норма языка и кто ее фиксирует, почему происходят изменения в ...
...В нашем обществе существует множество мифологических...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...
ХХIV Международный конкурс педагогов-русистов будет посвящен 225-летию со дня рождения А. С. Пушкина. Его тему организаторы сформулировали так: «Пушкин — наше всё. И что? Нужен ли русский гений новому поколению?» А вот более развернутая формулировка: «Зачем нужен поэт и его русский язык вашим ученикам? Возможно, самым мотивированным, чтобы работать на атомной станции, которую строит Россия. Учиться в вузе, где преподают московские ...
...ХХIV Международный конкурс педагогов-русистов будет...
Филолог Юлия Сафонова рассказывает в журнале «Наука и жизнь» о забытых русских словах.
...Филолог Юлия Сафонова рассказывает в журнале &...
...В книгах детского писателя Николая Носова были герои...
Литература, как и любая сложная система, развивается и эволюционирует. Какие-то произведения остаются в центре внимания читателей на десятки и даже сотни лет, другие забываются сразу после издания. Так работает «литературная эволюция», модель которой начинал разрабатывать русский филолог Юрий Тынянов. Применима ли эта концепция к отдельным частям произведения — например, к диалогу? Об исследованиях на эту тему пишет «Системный Блокъ».
...Литература, как и любая сложная система, развивается...
...Исследователь Института Макса Планка Олег Собчук в&...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...