Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Мы часто встречаем в составе слов компоненты, указывающие на большой размер или превосходную степень. Часто этот смысл передают заимствованные приставки. Мега — это явно что-то очень большое, гипер — огромное, экстра — высочайшего качества, а супер — превосходное во всех отношениях. У каждой из этих единиц есть смысловые оттенки, которые помогают понять, где она будет уместна.
...Мы часто встречаем в составе слов компоненты, указывающие...
...Супер: то, что сверху Латинское super — это...
Будучи сыном своего века (он родился в 1745 году, почти ровно посередине столетия), Фонвизин, тем не менее, не принимал многие явления, свидетелем которых он был, и часто не стеснялся идти против моды. Возможно, именно самостоятельность его суждений в итоге обеспечила ему место в истории не только русской литературы, но и литературного языка.
...Будучи сыном своего века (он родился в 1745 ...
...Способный ребенок Детство Дениса Ивановича Фонвизина...
Восьмое марта — противоречивый праздник: начался он с борьбы за равноправие женщин, а продолжается под пожелания «быть мужу воздухом весенним, быть летним солнцем для детей». Рассказать о том, как обстоят дела с неравноправием в языке, и выбрать подходящие поздравления с Женским днем, Грамоте помог Валерий Ефремов — доктор филологических наук, заведующий кафедрой русского языка филологического факультета РГПУ им. А. И. Герцена, соведущий программы «Как это по-русски» на «Радио России Петербург».
...Восьмое марта — противоречивый праздник:...
...Поэтка и блогерка против мастера маникюра Главные...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
...Появление интернета изменило в том числе и привычные...
...Что такое Национальный словарный фонд: концепция и...
В русском языке глагол-сказуемое согласуется с подлежащим по лицу и числу в настоящем времени и по роду и числу в прошедшем. Когда подлежащее выражено одним словом — существительным или местоимением, с согласованием не возникает проблем. Но если подлежащее нетипичное, возможны разные варианты. Применить корпусные методы к таким конструкциям сложно, потому что в корпусе они почти не встречаются. Но можно изучать их методами экспериментального синтаксиса.
...В русском языке глагол-сказуемое согласуется с подлежащим...
...Три стратегии выбора Мы будем рассматривать случаи...
Изучение систем коммуникации животных по понятным причинам долгое время ограничивалось наблюдениями. Затем появилась аппаратура, записывающая аудио- и видеоинформацию, возникла идея экспериментального подхода, и, наконец, на помощь специалистам пришли цифровые технологии и искусственный интеллект. Грамота рассказывает, как специалисты сегодня применяют эти методы и что узнаю́т с их помощью.
...Изучение систем коммуникации животных по понятным причинам...
...Наблюдение, слежка и прослушка Чтобы что-то понять...
Оценка языковой доступности учебных текстов для школьников сегодня не опирается на четкие критерии и прозрачную методологию. Так быть не должно, считает Антонина Лапошина — кандидат педагогических наук, специалист по компьютерной лингвистике из Института Пушкина. Она рассказала Грамоте о том, какие методы оценки текста есть в распоряжении экспертов и чем они могут быть полезны и школьникам, и авторам учебников.
...Оценка языковой доступности учебных текстов для школьников...
...Грамота: Какие проблемы должна решать лингвистическая...
21 февраля в мире отмечается Международный день родного языка. Его задача — напомнить о ценности всех тех языков, которые достались нам в наследство. Когда родной язык народа уходит из общественной жизни, ему грозит превращение в набор отдельных слов и обрывочных рассказов, интересующих лишь исследователей. Эта угроза существует и для языков некоторых коренных народов России. Но современные технологии дают таким языкам надежду.
...21 февраля в мире отмечается Международный день родного...
...Родные языки в опасности Языки выходят из употребления...