Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
АI (ИИ, искусственный интеллект), rizz (обаяние, привлекательность, шарм), Krisenmodus (кризисный режим) — такими разными словами запомнился 2023 год по версии разных источников. Объявление «слов года» в ноябре-декабре часто вызывает обсуждения и споры. Почему эта акция стала традиционной во многих странах и везде пользуется успехом? Чего в ней больше: любопытства и соревновательного азарта, желания уловить общественные настроения или внимания к развитию языка?
...АI (ИИ, искусственный интеллект), rizz (обаяние, привлекательность...
...Немецкие основоположники Первым языком, для которого...
Пожалуй, из всего того огромного количества слов, которые были в последние годы заимствованы русским языком, едва ли не самые жаркие споры, связанные с постановкой ударения, вызвало существительное «маркетинг», пришедшее из английского. Тех, кто выбирает вариант «марке́тинг», нередко обвиняют в безграмотности. Главный довод сторонников «ма́ркетинга»: так произносится это слово в языке-источнике.
...Пожалуй, из всего того огромного количества слов, которые...
...Удивляет многих носителей языка и несоответствие...
Поначалу слово из английского, французского или чешского языка кажется знакомым... и тут выясняется, что у него совершенно другое значение — иногда прямо противоположное. Любой, кто имеет дело с иностранными языками, хоть раз попадал впросак из-за «ложных друзей переводчика». Какие языковые процессы приводят к появлению таких слов? Можно ли их распознать и уберечься от ошибок?
...Поначалу слово из английского, французского или чешского...
...Что это за друзья такие Впервые эту метафору употребили...
Техническая документация наверняка была еще во времена Промышленной революции: любой станок требует хотя бы краткой инструкции по работе с ним. Но в компьютерную эпоху разнообразие и обилие программ, систем и устройств, которые надо описывать, привело к созданию нового функционального стиля речи со своей лексикой и фразеологией. Как вырабатывался этот стиль и какими качествами должно обладать удачное техническое описание, Грамоте рассказал технический писатель, один из авторов соответствующего профессионального стандарта Михаил Острогорский.
...Техническая документация наверняка была еще во времена...
...Придумать жанр Когда я только начинал заниматься технической...
Чтобы возникла лаконичная и удобная система Брайля, понадобилось объединить достижения человеческой мысли в разных областях: идеи просветителей, усилия педагогов, мастерство криптографов. Спустя двести лет шрифт Брайля не устарел и сегодня востребован в цифровом мире.
...Чтобы возникла лаконичная и удобная система Брайля...
...Новаторы XIX века В 1824 году пятнадцатилетний...
Предлагаем вниманию читателей портала статью Рубена Александровича Будагова, опубликованную в журнале «Русский язык в школе» (№ 2, 1968). В ней описаны разные версии происхождения слов-омонимов «мандарин», их судьба в разных языках, а также французское выражение «убить мандарина» и его связь с этическим выбором, описанным в романе Достоевского «Преступление и наказание».
...Предлагаем вниманию читателей портала статью Рубена...
...Предисловие «Грамоты.ру» Рубен Александрович...
Мы все знаем, что современный русский литературный язык начался с Пушкина. А что можно сказать о том русском языке, на котором говорили в XVIII веке, в частности, во времена Екатерины II? Какие в нем действовали нормы, какие новые слова в нем появились, чем различались устная речь и письменная? Чем отличалась русская грамматика XVIII века от современной? Обо всем этом Грамота расспросила филолога, специалиста по истории русского языка Екатерину Кислову.
...Мы все знаем, что современный русский литературный...
...Язык эпохи Екатерины II Специальный проект...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...