Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Вежливость в моем представлении встроена в речь гораздо глубже, чем соблюдение речевого этикета; она предполагает не только правильный выбор этикетных знаков, но и навык использования коммуникативных стратегий.
...Вежливость в моем представлении встроена в речь...
...Вот уже несколько десятилетий лингвистика находится...
На нашем портале появился новый раздел «Издательство». Теперь цифровая платформа «Грамота.ру» — это не только справочная служба, поиск по электронным словарям и справочникам, журнал для чтения и интерактивный учебник, но еще и книги. Какие книги издаются под брендом Грамоты сейчас и какие появятся в будущем? Мы расспросили об этом главного редактора издательства, кандидата филологических наук Ольгу Згировскую.
...На нашем портале появился новый раздел «Издательство...
...Грамота: Что для вас самое главное в Грамоте как...
Уральцы гордятся тюркизмом «айда», Сибирь — мультифорой, про питерский поребрик и парадные слышали все. Нет человека, которого бы не увлекала тема региональных слов. Лингвист Ирина Фуфаева рассказывает о словах, которые не переводятся на язык других регионов.
...Уральцы гордятся тюркизмом «айда», Сибирь...
...Внутри региональной лексики есть много отдельных интересных...
О том, как устроена проверка работ Тотального диктанта, по каким критериям его оценивают и как решают спорные вопросы, рассказала главный редактор издательства «Грамота» и председатель московской экспертной комиссии Тотального диктанта Ольга Згировская.
...О том, как устроена проверка работ Тотального...
...Кто проверяет Значительную часть проверяющих составляют...
Думаю, русский язык за последние 25 лет сильно изменился, что и должно происходить с любым живым языком. Возможно, этот процесс шел даже быстрее, чем в другие периоды, потому что наша жизнь меняется очень стремительно. И скорости увеличиваются, и целые новые области жизни появляются, а с ними и пласты слов.
...Думаю, русский язык за последние 25 лет сильно изменился...
...В первую очередь можно вспомнить всё, что связано с...
В школе говорят, что в русском языке у существительных, глаголов и других частей речи есть только две формы числа — единственное и множественное. Но исторически русский, как и многие другие языки, имел еще и двойственное число. Почему категория двойственности была утрачена? Как выглядели формы двойственного числа в древнерусском языке и где мы можем увидеть их следы?
...В школе говорят, что в русском языке у ...
...Что такое двойственное число Двойственное число, или...
Ежегодная образовательная акция «Тотальный диктант» установила новый рекорд по количеству участников. Как сообщил директор фонда «Тотальный диктант» Вячеслав Беляков на пресс-конференции в «Известиях», в этом году акция привлекла 1 329 047 человек по всему миру. Основная часть участников писала диктант в онлайн-формате. На очных площадках в России диктант написали 139 716 человек, за рубежом — 4 356 человек. Текст ...
...Ежегодная образовательная акция «Тотальный диктант...
Лингвисты из Института языкознания РАН выявили в материалах переписи населения 2021 года несколько языков, на которых больше не говорят. Анализируя ответы респондентов на вопрос, какими языками они владеют, специалисты обнаружили пять языков, которые отнесены к исчезнувшим (алеутский, керекский, айнский, сиреникский и югский), а также один, отнесенный к заснувшим (орочский). Общее между двумя категориями в том, что этими языками никто полноценно не владеет.
...Лингвисты из Института языкознания РАН выявили в ...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...