Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Русское правописание за десять с лишним веков менялось много раз, но, говоря о реформе орфографии, мы всегда имеем в виду реформу 1917 года. При этом внесенные в правописание изменения обсуждались русскими лингвистами задолго до самой реформы.
...Русское правописание за десять с лишним веков менялось...
...Реформы русской орфографии...
...Первые перемены Рефлексия на тему орфографии у наших...
Инструкции, законы, юридические договоры, профессиональные статьи чаще всего написаны специфическим языком. Хотя мы принимаем это как должное, исследования показывают: такая практика вредит экономике и обществу в целом.
...Инструкции, законы, юридические договоры, профессиональные...
...Почему писать хорошие тексты выгодно...
...Все мы при решении рабочих вопросов, чтении новостей...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Что такое векторные модели и как можно их использовать...
...Слово и его окружение Идея представления слова...
Коллективные ассоциативные поля похожи на клавиатуру. Писатель, как пианист, играет на этих клавишах. Он нажимает клавишу, молоточек бьет по струне — читатель слышит звук. Но если в мозгу читателя нужных струн не натянуто, то молоточек бьет в пустоту, звука нет, и что же тогда делать? Как прикажете играть на рояле без струн? А переводчик постоянно сталкивается с такой задачей.
...Коллективные ассоциативные поля похожи на клавиатуру...
...Школа игры на рояле без струн...
...Для начала — один реальный случай и ...
Оригинальность платоновских произведений ярче всего проявляется в языковом исполнении, в знаменитом платоновском стиле, которому невозможно найти аналог в русской литературе. Писатель работал в русле стилистических тенденций 1920-х годов, когда в художественных произведениях создавался необычный синтез речевой стихии и литературного языка. В духе общей тенденции платоновские вещи наполнены разноязыким говором революционной эпохи, революционной фразой и политическими лозунгами, новыми штампами, диалектными словами, нередко придающими речи персонажей комический эффект.
...Оригинальность платоновских произведений ярче всего...
...Комизм языка персонажей Андрея Платонова...
... Очень важно. Мое молодое, серьезное (смешное...
Люди давно поняли, что записывать слова от руки — слишком трудоемкий процесс. Чтобы быстро делиться большими объемами информации, нужно было этот процесс упростить и ускорить. И вот примерно полтора века назад решение было найдено. С тех пор человечество стучит по клавишам.
...Люди давно поняли, что записывать слова от руки &mdash...
...Всемирная история клавиатур: от букв вместо цифр до...
...«Ремингтон» и скорописец Английский инженер...
Когда ребенок русскоязычных родителей рождается вне России и оказывается в ситуации двуязычия, где лингвистическое внимание малыша распределяется между двумя и более языками, русский язык оказывается скорее «домашним» языком, нежели общеупотребительным. В этом случае русский язык может сохраниться как родной лишь при том условии, что он наполнится необходимым дополнительным личностным содержанием.
...Когда ребенок русскоязычных родителей рождается вне...
...Как поэтическая речь влияет на формирование родного...
...Для свободного владения языком мало просто понимать...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Как современные технологии помогают оценить сложность...
...Грамота: На что опираются системы оценки сложности/...
Кажется, что машины начали вести с нами диалог совсем недавно. На самом деле их история насчитывает несколько десятилетий. Сам термин «чат-бот» появился в 1994 году — его предложил компьютерный инженер Майкл Молдин. А идея программного обеспечения, способного взаимодействовать с людьми на естественном языке, родилась гораздо раньше. Грамота рассказывает о том, как разработчики в разные годы пытались научить бездушные машины общаться по-человечески.
...Кажется, что машины начали вести с нами диалог...
...Создать себе подобных: как люди придумали чат-ботов...
...Работа по сценарию Разработчики будущих чат-ботов...