резвой модест | Журнал | Поиск по Грамоте

Как цифровизация помогает сохранить языки коренных народов России

21 февраля в мире отмечается Международный день родного языка. Его задача — напомнить о ценности всех тех языков, которые достались нам в наследство. Когда родной язык народа уходит из общественной жизни, ему грозит превращение в набор отдельных слов и обрывочных рассказов, интересующих лишь исследователей. Эта угроза существует и для языков некоторых коренных народов России. Но современные технологии дают таким языкам надежду.

...21 февраля в мире отмечается Международный день родного...

...Родные языки в опасности Языки выходят из употребления...

Прогноз: текстовые данные для обучения нейросетей могут закончиться в ближайшие годы

В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...

...В течение многих лет такие компании, как OpenAI...

Компания Alibaba представила собственный ИИ-переводчик для международной торговли

Международная торговая компания Alibaba International Digital Commerce (AIDC) Group, известная как Alibaba, анонсировала запуск новой большой языковой модели Macro MT, разработанной специально для переводов в сфере международной торговли. Решение создать такой сервис в компании приняли после того, как обнаружили, что существующие инструменты перевода не учитывают в полной мере культурные особенности текстов. Модель будет встроена в системы управления ...

...Международная торговая компания Alibaba International...

Как отличить текст, написанный нейросетью? Ряд критериев предложен на «Хабре»

Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.

...Нейросети обучаются на текстах, которые создали люди...

...В последнее время искусственный интеллект далеко...

Фонетист Дмитрий Савинов: «Нет универсального алгоритма обучения орфоэпии»

В издательстве «Грамота» вышел школьный «Словарь трудностей русского произношения». Он поможет ученикам 5–11-х классов правильно произносить те слова, которые включены в школьную программу и часто встречаются в их речевой практике. О том, каким законам подчиняется развитие звуковой стороны языка и какие задачи решает новый словарь, мы поговорили с одним из его авторов, доктором филологических наук, ведущим научным сотрудником отдела фонетики Института русского языка им. В. В. Виноградова РАН Дмитрием Савиновым.

...В издательстве «Грамота» вышел школьный...

...Грамота: Чем ваш словарь отличается от обычного орфоэпического...

Как пишутся сложные топонимы: правила и исключения

Русская топонимика может показаться запутанной и нелогичной из-за многообразия вариантов написания. Например, почему Переславль-Залесский пишется через дефис, а Ростов Великий — раздельно? Разбираем сложные орфографические случаи и объясняем, с чем может быть связана разница.

...Русская топонимика может показаться запутанной и нелогичной...

...Раздельное написание топонимов Географические названия...

Двойные фамилии в русском языке: откуда они появились и как склоняются

Все мы знаем писателей Салтыкова-Щедрина и Мамина-Сибиряка, композитора Римского-Корсакова и гоголевского персонажа Сквозника-Дмухановского. В наши дни подобные двойные фамилии довольно редки, но всё еще встречаются. Каково происхождение этих фамилий и что важно знать об их склонении?

...Все мы знаем писателей Салтыкова-Щедрина и Мамина-Сибиряка...

...Ветви рода Самые древние среди русских двойных фамилий...

Нейросети проиграли людям при поиске грамматических ошибок

Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...

...Большие языковые модели (чат-боты на основе искусственного...

Новый толковый словарь — источник точной и интересной информации для школьника

Издательство «Грамота» выпустило новый словарь для 5–9-х классов. Его придумали и подготовили сотрудники Института русского языка им. В. В. Виноградова РАН, которые стремились соединить принципы академической лексикографии с потребностями и интересами современного школьника. Какие идеи заложены в словарь, что в нем особенного, чем он может быть полезен и интересен детям? Мы поговорили об этом с двумя членами авторского коллектива, кандидатами филологических наук Анной Владимировной Занадворовой, ведущим научным сотрудником отдела современного русского языка, и Еленой Андреевной Никишиной, научным сотрудником того же отдела и доцентом Школы лингвистики НИУ ВШЭ.

...Издательство «Грамота» выпустило новый...

...Зачем понадобился новый словарь? Анна Занадворова:...

Польский и русский оказались эффективнее английского при поиске информации

Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —

...Недавнее исследование, проведенное учеными из ...

Почитать на грамоте