Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
В ЕГЭ по русскому языку станет допустимым прибегать к интерпретации сюжета мультфильма, аниме, манги, комикса, графического романа или компьютерной игры. Об этом говорится в опубликованном на сайте Федерального института педагогических измерений (ФИПИ) «Навигаторе самостоятельной подготовки к экзамену». Использовать подобные аргументы можно будет в задании 27, в котором требуется написать сочинение по прочитанному тексту. В
...В ЕГЭ по русскому языку станет допустимым прибегать...
Проблема различения языка и диалекта не перестает быть актуальной для взаимоотношений разных народов и стран. От лингвистов требуют предъявить строгие научные критерии разграничения этих понятий, но в действительности едва ли не большую роль играют экстралингвистические факторы.
...Проблема различения языка и диалекта не перестает быть...
...Задача с двумя неизвестными Представим, что есть два...
О нововведении сообщил директор Координационного центра доменов .RU/.РФ Андрей Воробьев, выступая на круглом столе «Кириллица в интернете. Домен .РФ — символ значимости русского языка в современном мире». Воробьев уточнил, что принятие окончательного решения учредителями домена ожидается в июне текущего года. «Сейчас идет тестирование с регистраторами, скоро можно будет зарегистрировать имена с 25 новыми символами, — объяснил гендиректор ООО «
...О нововведении сообщил директор Координационного центра...
О том, какие пунктуационные и орфографические «вызовы» требуют решения, ведущая программы Ольга Северская поговорила с членом Орфографической комиссии РАН, доцентом кафедры русского языка МАрхИ и преподавателем НИУ ВШЭ Марией Ровинской.
...О том, какие пунктуационные и орфографические...
...Мы привыкли оценивать грамотность человека в основном...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Когда язык заимствует новое слово, его правописание и произношение не всегда очевидно и может варьироваться: например, нон-фикшен и нонфикшн, фэнтези и фентези… Мы составили список «проблемных» слов, которые часто ищут на Грамоте, чтобы напомнить, какова для них текущая орфографическая норма. И попробовали выявить закономерности или хотя бы подсказки, которые помогают предвидеть, как поведет себя заимствованное слово в русском языке.
...Когда язык заимствует новое слово, его правописание...
...1. Шорт-лист В чем сложность: раздельно, слитно или...
37% участников опроса Фонда «Общественное мнение» (ФОМ) согласны с тем, что иностранные языки преподаются в большинстве общеобразовательных школ скорее плохо. У 35% нареканий нет, еще 28% затруднились с ответом. Опрос показал, что три четверти россиян (76%) не считают владение иностранными языками необходимым навыком. Больше всего разделяющих эту мысль среди опрошенных старше 60 лет (87%), а меньше всего — среди молодежи до
...37% участников опроса Фонда «Общественное мнение...
Бедность речи половина опрошенных русистов считает главной проблемой современного русского языка. На втором месте оказалось упрощение языка — его отметили 17% респондентов. Речь идет о написаниях вроде «щас» вместо «сейчас» и неверных ударениях (договорА вместо договОры). Распространение бранной лексики волнует 13% преподавателей. А вот активное заимствование иностранных слов беспокоит лишь 10% учителей. Примерно столько
...Бедность речи половина опрошенных русистов считает...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...