Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
15–16 сентября 2023 года в Институте русского языка им. В. В. Виноградова РАН (Москва) пройдет III конференция «Языки России в контакте с русским языком». Основные темы докладов: явления в грамматике и лексике автохтонных языков России, обусловленные контактом с русским языком или контактами автохтонных языков друг с другом; радикальные изменения в грамматике и лексике малых языков России в ситуации языкового сдвига (массового перехода носителей на русский язык или на ...
...15–16 сентября 2023 года в Институте русского...
Онлайн-словарь диалектизмов «Русским языком говорю» должен объединить сотни слов, бытующих в разных регионах России. Это совместная инициатива портала «Культура.РФ» и социальной сети «Одноклассники». Например, словом сморщ в Брянской области называют борщ, а словом гостинка в Приморском крае — маленькую квартиру. Поиск по сайту позволяет найти диалектные слова по первой букве, по региону или по значению. Любой ...
...Онлайн-словарь диалектизмов «Русским языком говорю...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...
Корнский (Kernowek, англ. Cornish) — потомок древнего бриттского языка, на котором говорило коренное население острова Корнуэлл до прихода англосаксов. С V века число носителей языка постепенно сокращалось, а последние корноговорящие жители (для кого этот язык был первым и главным) умерли в конце XVIII века, хотя, по некоторым данным, язык в какой-то степени сохранялся и в течение XIX века. В 2009 году ООН признала язык ...
...Корнский (Kernowek, англ. Cornish) — потомок...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
На сайте Русского географического общества опубликовано интервью с кандидатом филологических наук, старшим научным сотрудником Института языкознания РАН и специалистом по лингвистической картографии Юрием Коряковым.
...На сайте Русского географического общества опубликовано...
...Идея создания «Карты языков России» возникла...
«Чем проще, тем лучше» — это правило действует во многих областях, в том числе в работе с текстами. Например, тяжелый слог юридических документов раздражает и профессиональных юристов, и их клиентов. Но, как выясняется, есть исключения. Когда речь идет о заголовках новостных статей, профессионалы и читатели не так единодушны в своих предпочтениях. Исследователи из США провели несколько экспериментов, чтобы выяснить это. Для ...
...«Чем проще, тем лучше» — это...
На XI Международной конференции Тотального диктанта «Динамические процессы в современном русском языке» выступил с лекцией академик РАН, автор научно-просветительского бестселлера «Почему языки такие разные» Владимир Александрович Плунгян. Лекция была посвящена сохранению языкового многообразия на территории Российской Федерации.
...На XI Международной конференции Тотального диктанта...
...Всего в России 152 языка (по системе подсчета Ю. Б....
«Заметки на полях» — совместный проект Тотального диктанта и сервиса МТС «Строки». Научный руководитель Грамоты Владимир Пахомов ведет его вместе с писательницей Ириной Лейк. В первом выпуске ведущие обсудили интересные слова и выражения — как модные и современные, так и из лексикона Льва Толстого.
...«Заметки на полях» — совместный проект...
...Ведущие вспомнили школьные годы, когда они впервые...