Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Предлагаем вниманию читателей статью Сергея Петровича Обнорского, опубликованную в журнале «Русский язык в школе» (№ 5–6, 1939). Статья представляет собой текст доклада, прочитанного на заседании Правительственной комиссии по разработке единой орфографии и пунктуации 7 октября 1939 года. В этой работе рассматриваются спорные орфографические вопросы, стоявшие перед лингвистами в 1930-е годы, при подготовке общеобязательного свода правил русского правописания.
...Предлагаем вниманию читателей статью Сергея Петровича...
...Предисловие «Грамоты.ру» Сергей Петрович...
Фразеология часто оказывается самой непонятной частью языка не только для иностранцев, но и для младших поколений, которые редко встречали и никогда не употребляли выражения вроде «семь пятниц на неделе». Многие идиомы кажутся устаревшими и ассоциируются с речью бабушек и дедушек. Но никогда не поздно разобраться, какой смысл имеют истории про белок, комаров, баранов и молочные реки, даже если вы сами использовать эти выражения не собираетесь. Мы выбрали семь идиом, которые чаще других ищут на Грамоте — и не находят! Самое время дополнить Справочник по фразеологии.
...Фразеология часто оказывается самой непонятной частью...
...Крутиться как белка в колесе Образ. Белка, которая...
Владимир Гиляровский писал стихи, рассказы и очерки, общался с Чеховым и Горьким, был редактором газеты и самым известным москвоведом своего времени. В Музее Москвы открылась выставка, посвященная 170-летию со дня его рождения. О его бурной жизни и разнообразных занятиях Грамоте рассказал старший научный сотрудник Музея Москвы, историк Александр Афанасов.
...Владимир Гиляровский писал стихи, рассказы и очерки...
...Биографические подробности Согласно официальным документам...
Ясный язык — это специальная упрощенная форма языка, для каждого языка — своя. В ней нет сложных и длинных конструкций, а слова сопровождаются простыми и наглядными картинками-пиктограммами. Чтобы создать «ясноязычную» версию текста, нужно владеть специальными навыками, ведь задача такой версии — помочь людям, которым по разным причинам трудно прочитать и понять то, что написано обычным языком.
...Ясный язык — это специальная упрощенная форма...
...Кому нужен ясный язык По мнению нейропсихолога Елены...
«Чем проще, тем лучше» — это правило действует во многих областях, в том числе в работе с текстами. Например, тяжелый слог юридических документов раздражает и профессиональных юристов, и их клиентов. Но, как выясняется, есть исключения. Когда речь идет о заголовках новостных статей, профессионалы и читатели не так единодушны в своих предпочтениях. Исследователи из США провели несколько экспериментов, чтобы выяснить это. Для ...
...«Чем проще, тем лучше» — это...
В статье рассматриваются проблемы теории и истории языкознания рубежа XIX–XX веков, получившие развитие в трудах видного лингвиста Дмитрия Николаевича Кудрявского (1867–1920). Автор обращает особое внимание на обзор научных идей, изложенных в новаторском курсе лекций «Введение в языковедение», их связь с новыми тенденциями в отечественной и мировой науке начала XX века и подчеркивает их значение для осмысления последующей лингвистической традиции в России. В статье приведены также малоизвестные факты сотрудничества Д. Н. Кудрявского с «Энциклопедическим словарем» Брокгауза и Ефрона.
...В статье рассматриваются проблемы теории и истории...
...Только постоянное нарушение живой речью устанавливаемых...
Об этом 15 сентября сообщил главный разработчик системы — Удмуртский федеральный исследовательский центр Уральского отделения РАН. Корпус представляет собой информационно-справочную систему, основанную на собрании текстов в электронной форме. Объем Корпуса на данный момент составляет порядка 6,2 млн словоупотреблений. Сейчас, по словам авторов, продолжается формирование корпуса современного удмуртского литературного языка, а также разработка корпуса письменных памятников. В ...
...Об этом 15 сентября сообщил главный разработчик системы...
В старые времена люди переписывали книги пером: «что написано пером, не вырубишь топором»... Относительно недавно многие писали от руки большие тексты и только потом печатали их на пишущей машинке. Сегодня мы всё реже оказываемся в ситуации, когда без ручного письма не обойтись. Значит ли это, что скоро оно отомрет за ненадобностью? Или у него есть ценные стороны, которые дадут шанс на долгую жизнь?
...В старые времена люди переписывали книги пером...
...Как развивалась письменность Изначально для передачи...
Коммуникативный запрет — это не «стоп-лист», а добровольный отказ от той или иной модели речевого поведения. Таково видение обсуждаемой проблемы Владимира Ильича Карасика, доктора филологических наук, профессора кафедры общего и русского языкознания Института Пушкина. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...Коммуникативный запрет — это не «стоп-лист...
...Один из известнейших дискурсологов Владимир Карасик...