Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Каждый, кто пишет в газете или популярном журнале о науке, знает, какие мучения вызывает «ввод» научного термина. Часто это слово не знакомо широкому читателю, непонятно даже из контекста и, как правило, воспринимается как «некрасивое» для русского уха и глаза. Сейчас привычные языковые стили меняются, приобретая новые черты. Что представляет собой новый язык науки? Каким становится главное научное слово — термин?
...Каждый, кто пишет в газете или популярном журнале о...
...Сложившийся к началу XX века научный язык — тот...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Сравнение двух языковых моделей проводили методом Side-by-Side (букв. «бок о бок»). Обеим нейросетям предлагали один и тот же запрос, а затем эксперты выбирали лучший ответ вслепую (не зная, какой из сервисов его дал). Для эксперимента авторы брали обезличенные обращения пользователей продуктов «Яндекса» к нейросети YandexGPT 2. Выборка учитывала реальные потребности людей и охватила множество различных тем, сообщают в компании. По словам технического директора ...
...Сравнение двух языковых моделей проводили методом Side-by-Side...
О начале разработки сообщил марийский лингвист, научный сотрудник Марийского института языка, литературы и истории Андрей Чемышев. Проекту уже дали название «iВика», созвучное с марийским женским именем Айвика. В целом набор функций цифрового помощника будет таким же, как у других подобных продуктов: он сможет найти информацию в интернете и зачитать ее, добавить встречу в календарь, включить песню, рассказать сказку или анекдот. Изюминка — в языке. Колонки с ...
...О начале разработки сообщил марийский лингвист, ...
23 января отмечается День ручного письма. Эта памятная дата была учреждена в 1977 году для повышения интереса к искусству калиграфии в эпоху, когда все меньше людей пишут от руки. Пожалуй, единственное место, где еще приходится постоянно пользоваться ручкой, — это школа. Большинство образовательных систем знакомят детей с письмом, предлагая им выводить буквы от руки. При этом школьное обучение активно цифровизируется, а использование ...
...23 января отмечается День ручного письма. Эта...
Конструкции вроде в связи с необходимостью повышения эффективности деятельности коммунальных служб проводится ряд мероприятий — знакомая многим проблема бюрократического языка. О «канцелярите» как болезни языка писал еще Корней Чуковский, призывая писать просто и понятно. Но что делать с этой профессиональной деформацией чиновников? Возможно, решить эту проблему в России удастся с помощью новых технологий.
...Конструкции вроде в связи с необходимостью...
С 1 апреля вступил в силу закон, обязывающий детей иностранных граждан и лиц без гражданства подтверждать знание русского языка для поступления в российские школы. Одновременно была запущена процедура тестирования детей. Диагностические материалы разработал Федеральный институт педагогических измерений (ФИПИ). Для детей, поступающих в первый класс, предусмотрена только устная часть, начиная со второго класса добавляется письменная. Потенциальному первокласснику предложат ответить на ...
...С 1 апреля вступил в силу закон, обязывающий детей...
Московская международная книжная ярмарка 2025 года пройдет на ВДНХ, в павильоне 57. Гости смогут не только познакомиться с книжными новинками, но и посетить десятки мероприятий, имеющих отношение к книжному миру. Специально для участников ярмарки лингвисты Грамоты проведут 6 сентября интеллектуальную игру «Творец слов». Игра пройдет на улице перед павильоном 57, на площадке 11 «Пространство чтения: территория будущего». Игрокам предстоит в ...
...Московская международная книжная ярмарка 2025 года...
С апреля по август 2025 года тестирование на знание русского языка, необходимое для зачисления иностранцев в российские школы, прошли 5 940 человек. Успешно справились с ним 2 964 ребенка — примерно половина от общего числа сдававших. Таковы общероссийские результаты, которыми поделилась Федеральная служба по наздору в сфере образования и науки (Рособрнадзор). Всего за это время в российские школы было подано 23 616 заявок от иностранных граждан. Однако большинство ...
...С апреля по август 2025 года тестирование на ...