Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Представление о том, что такое хорошая речь, исторически изменчиво. В XX веке не может быть признана хорошей та речь, которая была образцовой не только для XVIII, но и для первой половины XIX века. Даже если мы читаем тексты «создателя современного русского языка», каковым по праву считается А. С. Пушкин.
...Представление о том, что такое хорошая речь, исторически...
...Значительно сложнее обстоит дело с речью конца XIX...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
15–16 сентября 2023 года в Институте русского языка им. В. В. Виноградова РАН (Москва) пройдет III конференция «Языки России в контакте с русским языком». Основные темы докладов: явления в грамматике и лексике автохтонных языков России, обусловленные контактом с русским языком или контактами автохтонных языков друг с другом; радикальные изменения в грамматике и лексике малых языков России в ситуации языкового сдвига (массового перехода носителей на русский язык или на ...
...15–16 сентября 2023 года в Институте русского...
Онлайн-словарь диалектизмов «Русским языком говорю» должен объединить сотни слов, бытующих в разных регионах России. Это совместная инициатива портала «Культура.РФ» и социальной сети «Одноклассники». Например, словом сморщ в Брянской области называют борщ, а словом гостинка в Приморском крае — маленькую квартиру. Поиск по сайту позволяет найти диалектные слова по первой букве, по региону или по значению. Любой ...
...Онлайн-словарь диалектизмов «Русским языком говорю...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...
Корнский (Kernowek, англ. Cornish) — потомок древнего бриттского языка, на котором говорило коренное население острова Корнуэлл до прихода англосаксов. С V века число носителей языка постепенно сокращалось, а последние корноговорящие жители (для кого этот язык был первым и главным) умерли в конце XVIII века, хотя, по некоторым данным, язык в какой-то степени сохранялся и в течение XIX века. В 2009 году ООН признала язык ...
...Корнский (Kernowek, англ. Cornish) — потомок...
На сайте Русского географического общества опубликовано интервью с кандидатом филологических наук, старшим научным сотрудником Института языкознания РАН и специалистом по лингвистической картографии Юрием Коряковым.
...На сайте Русского географического общества опубликовано...
...Идея создания «Карты языков России» возникла...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
На XI Международной конференции Тотального диктанта «Динамические процессы в современном русском языке» выступил с лекцией академик РАН, автор научно-просветительского бестселлера «Почему языки такие разные» Владимир Александрович Плунгян. Лекция была посвящена сохранению языкового многообразия на территории Российской Федерации.
...На XI Международной конференции Тотального диктанта...
...Всего в России 152 языка (по системе подсчета Ю. Б....