К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
В столице подвели итоги IX Всероссийской общественной премии «Ключевое слово». Награждение прошло в рамках форума «Языковая политика в Российской Федерации». Экспертный совет рассмотрел 250 заявок из 55 регионов страны, отобрав лучшие инициативы по сохранению и развитию языкового многообразия. Победители 2025 года: Лучшим ИТ-проектом признан портал «Татар галәме» — единая экосистема для обучения и
...В столице подвели итоги IX Всероссийской...
26 мая скончалась Елена Яковлевна Шмелева — кандидат филологических наук, заместитель директора Института русского языка им. В. В. Виноградова РАН, специалист по семантике и культуре речи, орфографии и лексикографии, словообразованию и преподаванию русского языка. Ей было 67 лет. Выпускница отделения структурной и прикладной лингвистики филологического факультета МГУ им. М. В. Ломоносова 1979 года, в том же году поступила в аспирантуру Института русского ...
... 26 мая скончалась Елена Яковлевна Шмелева...
Онлайн-словарь Лексикон — проект Грамоты, оперативно реагирующий на изменения в живой речи, — пополнился блоком лексики из сферы еды и кулинарии. Это слова, которые активно используются в ресторанной сфере и повседневном общении, но могут вызвать затруднения при письме, а их точный смысл не всегда понятен. Получили лексикографическое описание такие слова, как ...
...Онлайн-словарь Лексикон — проект Грамоты...
Современные программы, которые генерируют тексты, научились писать довольно складно. Однако они часто спотыкаются именно на сложных правилах русского языка, поскольку в материалах, на которых их обучают, примеров применения таких правил крайне мало. Исследователи из МГУ и «Яндекса» разработали специальный учебный материал, призванный помочь программам лучше понимать и применять правила орфографии и пунктуации. Речь идет о самых трудных ...
...Современные программы, которые генерируют тексты, научились...
Думаю, русский язык за последние 25 лет сильно изменился, что и должно происходить с любым живым языком. Возможно, этот процесс шел даже быстрее, чем в другие периоды, потому что наша жизнь меняется очень стремительно. И скорости увеличиваются, и целые новые области жизни появляются, а с ними и пласты слов.
...Думаю, русский язык за последние 25 лет сильно изменился...
...В первую очередь можно вспомнить всё, что связано с...
Большинство детей с иностранным гражданством, чьи родители хотят отдать их учиться в российскую школу, не были допущены до тестирования на знание русского языка. Как пишет РБК со ссылкой на Рособрнадзор, среди причин отказа — неполный пакет документов, недостоверные сведения, указанные в документах, и отсутствие мест в школах. Из 1,8 тыс. заявивших о желании сдать языковой тест такую возможность получили 335 человек. Пока этой возможностью воспользовались ...
...Большинство детей с иностранным гражданством, чьи родители...
Могут ли невежливые запросы снизить качество ответов больших лингвистических моделей вроде ChatGPT? Группа ученых из Университета Васэда (Япония) проверила это предположение на нескольких моделях и трех языках — английском, китайском и японском. В разных языках способы проявления вежливости отличаются. Например, в английском языке есть универсальные слова и конструкции, которые позволяют вежливо обратиться к любому собеседнику. В японском языке ...
...Могут ли невежливые запросы снизить качество ответов...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Принципы коммуникативной эффективности и основы права требуют, чтобы законы были понятны обывателям, однако эмпирические данные свидетельствуют о том, что юридические документы в основном непонятны как юристам, так и неспециалистам. Как известно, законы содержат поразительно высокий уровень сложных синтаксических структур по сравнению с другими жанрами текстов. В исследовании, опубликованном в PNAS, ученые из США, Великобритании и Австралии ...
...Принципы коммуникативной эффективности и основы...