Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
22 ноября отмечается День словарей и энциклопедий. Это день рождения Владимира Даля, создателя «Толкового словаря живого великорусского языка», внесшего огромный вклад в развитие русского языка и российской лексикографии. В 2016 году Институт русского языка им. В. В. Виноградова создал научно-информационный орфографический ресурс «Академос», который постоянно пополняется. В 2023 году в него было добавлено более ста новых статей. Среди них есть слова и ...
...В орфографический ресурс «Академос» добавили более...
...22 ноября отмечается День словарей и энциклопедий....
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Российские исследователи предложили новую модель генерации...
...Ключевые слова в научных статьях, монографиях...
Новую разработку представили выпускники Института прикладных информационных технологий и коммуникаций Саратовского государственного технического университета им. Ю. А. Гагарина (ИнПИТ СГТУ). Приложение позволяет изучать теоретические основы РЖЯ, просматривать словарь и овладевать отдельными жестами, проверять свои знания и проходить интерактивное тестирование. Уникальность приложения в том, что в него встроена нейросеть, которая ...
...Приложение для распознавания русского жестового языка...
...Новую разработку представили выпускники Института...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...В Москве прошла первая стратегическая сессия «Информационные...
...Александр Антонов, руководитель группы оценки качества...
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Владимир Плунгян: «Первый урок корпуса — не злоупотреблять...
...Грамота: Все, кто работает с языком как исследователи...
АI (ИИ, искусственный интеллект), rizz (обаяние, привлекательность, шарм), Krisenmodus (кризисный режим) — такими разными словами запомнился 2023 год по версии разных источников. Объявление «слов года» в ноябре-декабре часто вызывает обсуждения и споры. Почему эта акция стала традиционной во многих странах и везде пользуется успехом? Чего в ней больше: любопытства и соревновательного азарта, желания уловить общественные настроения или внимания к развитию языка?
...АI (ИИ, искусственный интеллект), rizz (обаяние, привлекательность...
...Мир в поисках слов года...
...Немецкие основоположники Первым языком, для которого...
Русский язык существует не одно столетие и, как и любой другой язык, меняется с течением времени — это касается как живого разговорного языка, так и литературного стандарта. Каким был русский язык в разные периоды, какой путь он прошел от времен Руси до наших дней? Попробуем выделить ключевые моменты.
...Русский язык существует не одно столетие и, как...
...Периоды развития русского языка: древний, старый, новый...
...Древнерусский язык (IX–XIV века) Когда...
Выбором «слова года» занимаются авторитетные словари, языковые институты, газеты и сайты. С недавнего времени такую акцию проводит и Грамота. Чем отличается наш подход к определению «слова года»? Как мы собираем данные, фильтруем и оцениваем их? Приоткрываем дверь на нашу социолингвистическую кухню. И предупреждаем: у большого «слова года» будет свита из «главных слов» в разных сферах.
...Выбором «слова года» занимаются авторитетные...
...Слово года по версии Грамоты. Как мы его выбираем?...
...Вторые «выборы»: развиваем методологию...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Кому и зачем нужен Национальный корпус русского языка...
...Грамота: С какими целями создавался корпус? А. К.:...