Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...
Каждый день мы сталкиваемся с огромным количеством больших и маленьких текстов, но не всегда нам удается сразу осознать прочитанное. Что такое читательская грамотность и почему ее важно развивать? Грамота публикует статью нашего партнера, Всероссийского чемпионата сочинений «Своими словами», которая помогает увидеть сбои в логике, фантазии, преувеличения и неправомерные обобщения там, где при обычном чтении мы не замечаем ничего подозрительного.
...Каждый день мы сталкиваемся с огромным количеством...
...Почему мы можем неверно понять текст Чтобы разобраться...
Латинский язык нельзя назвать мертвым в той же мере, что древнеегипетский, хеттский или даже древнегреческий. Традиция преподавания латинского языка непрерывна и восходит к средневековым университетам; его до сих пор изучают историки, юристы, богословы, медики. Но уйти в прошлое ему не дают главным образом филологи-классики и многочисленные энтузиасты, которые до сих пор используют его для живого общения.
...Латинский язык нельзя назвать мертвым в той же...
...Где он живет Чтобы язык считался хоть сколько-нибудь...
Казалось бы, дореволюционная русская орфография перестала существовать больше ста лет назад. Между тем наши современники продолжают по разным причинам ее использовать — кто-то в силу симпатий к дореволюционной России и ее культуре, кто-то из эстетических соображений. Энтузиасты ведут блоги, переиздают и пишут книги в старой орфографии. О том, какие мотивы стоят за этим выбором, Грамоте рассказал филолог Алексей Любжин.
...Казалось бы, дореволюционная русская орфография перестала...
...Замысел: «Орфография и стилистика растут из одного...
Английский термин Tone of Voice (сокращенно ToV) обозначает ту интонацию, которую улавливает в тексте читатель. Этот термин пришел из маркетинга и сначала касался только бизнес-коммуникаций, голоса бренда. Затем он стал применяться к любым видам коммуникаций с аудиторией, в том числе и к тому, как государство говорит с гражданами. И, наконец, сблизился с тем, что понимается на школьных уроках литературы под «образом автора». Как устроен этот образ и что может сделать пишущий, чтобы тональность текста попала в цель?
...Английский термин Tone of Voice (сокращенно ToV) обозначает...
...Образ автора, неуловимый и вездесущий ToV описывает...
Инструкции, законы, юридические договоры, профессиональные статьи чаще всего написаны специфическим языком. Хотя мы принимаем это как должное, исследования показывают: такая практика вредит экономике и обществу в целом.
...Инструкции, законы, юридические договоры, профессиональные...
...Все мы при решении рабочих вопросов, чтении новостей...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Какую опасность таит в себе Интернет с точки зрения филолога-русиста? Опасность размывания орфографических, грамматических и лексико-стилистических норм, разрушения границ жанра. Может ли Интернет сослужить пользу в благородном деле возрождения культуры речи, популяризации русского языка и поддержания его литературных норм? Безусловно, да, так как Интернет предоставляет безграничные возможности для обсуждения проблем существования и развития современного русского литературного языка, для распространения правил и норм его употребления.
...Какую опасность таит в себе Интернет с точки зрения...
...Нет никаких сомнений в том, что русский Интернет...
Восьмого апреля в 43 странах прошла акция «Тотальный диктант». Четыре фрагмента текста Василия Авченко написали онлайн и на очных площадках. «Участники из 43 стран написали двадцатый диктант в очном формате, 103 страны присоединились к акции в рамках онлайн-марафона и онлайн-диктанта. В России диктант фирменной юбилейной ручкой xGold на очных площадках написали более 125 000 человек. Больше всего участников в России традиционно собралось в Москве, куда пришли чуть ...
...Восьмого апреля в 43 странах прошла акция «Тотальный...