К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
26 мая скончалась Елена Яковлевна Шмелева — кандидат филологических наук, заместитель директора Института русского языка им. В. В. Виноградова РАН, специалист по семантике и культуре речи, орфографии и лексикографии, словообразованию и преподаванию русского языка. Ей было 67 лет. Выпускница отделения структурной и прикладной лингвистики филологического факультета МГУ им. М. В. Ломоносова 1979 года, в том же году поступила в аспирантуру Института русского ...
... 26 мая скончалась Елена Яковлевна Шмелева...
Современные программы, которые генерируют тексты, научились писать довольно складно. Однако они часто спотыкаются именно на сложных правилах русского языка, поскольку в материалах, на которых их обучают, примеров применения таких правил крайне мало. Исследователи из МГУ и «Яндекса» разработали специальный учебный материал, призванный помочь программам лучше понимать и применять правила орфографии и пунктуации. Речь идет о самых трудных ...
...Современные программы, которые генерируют тексты, научились...
Цифровые образовательные материалы получат народы, не имеющие достаточного количества учебников родного языка и литературного чтения. Об этом сообщает ТАСС со ссылкой на пресс-службу издательства «Наука». Суть проекта в том, что активисты-киберволонтеры собирают данные о существующих учебных пособиях, созданных носителями языков и учеными. Эти пособия и другая литература, помогающая сохранять и преподавать языки коренных народов, сначала выпускается ...
...Цифровые образовательные материалы получат народы,...
Большинство детей с иностранным гражданством, чьи родители хотят отдать их учиться в российскую школу, не были допущены до тестирования на знание русского языка. Как пишет РБК со ссылкой на Рособрнадзор, среди причин отказа — неполный пакет документов, недостоверные сведения, указанные в документах, и отсутствие мест в школах. Из 1,8 тыс. заявивших о желании сдать языковой тест такую возможность получили 335 человек. Пока этой возможностью воспользовались ...
...Большинство детей с иностранным гражданством, чьи родители...
Пол Грэм — американский программист, предприниматель, один из создателей бизнес-инкубатора Y Combinator для стартапов в сфере информационных технологий. А еще человек пишущий — автор нескольких книг по программированию и многочисленных эссе, например «Как начать стартап» и «Как правильно возражать». В октябре он опубликовал в своем блоге текст об умении писать тексты. Грамота перевела его для вас, воспользовавшись помощью нейросетевых технологий.
...Пол Грэм — американский программист, предприниматель...
...Обычно я неохотно делаю прогнозы относительно технологий...
Могут ли невежливые запросы снизить качество ответов больших лингвистических моделей вроде ChatGPT? Группа ученых из Университета Васэда (Япония) проверила это предположение на нескольких моделях и трех языках — английском, китайском и японском. В разных языках способы проявления вежливости отличаются. Например, в английском языке есть универсальные слова и конструкции, которые позволяют вежливо обратиться к любому собеседнику. В японском языке ...
...Могут ли невежливые запросы снизить качество ответов...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Принципы коммуникативной эффективности и основы права требуют, чтобы законы были понятны обывателям, однако эмпирические данные свидетельствуют о том, что юридические документы в основном непонятны как юристам, так и неспециалистам. Как известно, законы содержат поразительно высокий уровень сложных синтаксических структур по сравнению с другими жанрами текстов. В исследовании, опубликованном в PNAS, ученые из США, Великобритании и Австралии ...
...Принципы коммуникативной эффективности и основы...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...В середине сентября Робин Спир, создательница проекта...