К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Практически всем приходится время от времени заниматься заполнением документов, будь то трудовой договор, претензия к производителю товара или заявление о замене счетчиков воды. Такие тексты написаны в специфическом узнаваемом стиле, который называется официально-деловым. Каковы особенности этого стиля и почему он склонен к экспансии?
...Практически всем приходится время от времени заниматься...
...Из истории отечественного делопроизводства Традиция...
Предложение о создании в рамках СНГ международной структуры по поддержке и продвижению русского языка президент Казахстана выдвинул еще в декабре 2021 года на встрече с Владимиром Путиным. Эту идею поддержали и другие страны-участницы, а 2023 год был объявлен Годом русского языка в СНГ. В начале сентября эксперты доработали и согласовали проект договора об учреждении Международной организации по русскому языку. А в рамках саммита СНГ, проходившего 13 октября в Бишкеке, главы стран-участниц ...
...Предложение о создании в рамках СНГ международной структуры...
Когда говорят о заимствованиях, чаще всего представляют себе иностранные слова, проникающие в русский язык. А как насчет обратного пути — из русского языка в другие? Таких случаев тоже немало, и это отнюдь не только банальные vodka и sputnik. О некоторых интересных перемещениях слов рассказывает лингвист Мария Елифёрова.
...Когда говорят о заимствованиях, чаще всего представляют...
...Самое древнее заимствование из русского, восходящее...
Портал «Элементы» предлагает поломать голову над новыми задачами: проанализировать закономерности отражения праиндоевропейских звуков в славянских языках, выявить русские заимствования в польском и польские в русском среди слов, которые восходят к общему корню, а также перевести фразы с русского на язык маори и наоборот.
...Портал «Элементы» предлагает поломать голову...
...Язык из ниоткуда Задача от лингвиста Александра Пиперски...
Бывает так, что устаревшие слова, которые уже находятся на периферии языка, в дальнем ящике, на чердаке, употребляются очень редко, вдруг начинают возвращаться к активной жизни. Лингвист Ирина Фуфаева рассказывает историю одной такой реинкарнации.
...Бывает так, что устаревшие слова, которые уже находятся...
...Для реинкарнации слов находится масса причин. Некоторое...
Статьи номера посвящены произношению согласных, восприятию диалекта, карнавализации, семантике глагольных циркумфиксов и слова «Земля», а также языку образов времени и языку художественной литературы. Отметим некоторые из них.
...Статьи номера посвящены произношению согласных, восприятию...
...К семантике русских глагольных циркумфиксов. Циркумфикс...
Статья научного консультанта Грамоты Владимира Пахомова в журнале «Неофилология» рассказывает о жизненном пути, научном и просветительском наследии Михаила Панова — лингвиста, педагога, популяризатора науки, в 1960-е годы — заместителя председателя Орфографической комиссии.
...Статья научного консультанта Грамоты Владимира Пахомова...
...Реформа русской орфографии, которая готовилась в ...