Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В статье рассматриваются проблемы теории и истории языкознания рубежа XIX–XX веков, получившие развитие в трудах видного лингвиста Дмитрия Николаевича Кудрявского (1867–1920). Автор обращает особое внимание на обзор научных идей, изложенных в новаторском курсе лекций «Введение в языковедение», их связь с новыми тенденциями в отечественной и мировой науке начала XX века и подчеркивает их значение для осмысления последующей лингвистической традиции в России. В статье приведены также малоизвестные факты сотрудничества Д. Н. Кудрявского с «Энциклопедическим словарем» Брокгауза и Ефрона.
...В статье рассматриваются проблемы теории и истории...
...Только постоянное нарушение живой речью устанавливаемых...
Какие этапы проходит иноязычное слово, прежде чем стать своим, окончательно закрепиться в русском языке? Об этом – в интереснейшей статье Леонида Петровича Крысина «Этапы освоения иноязычного слова», опубликованной в журнале «Русский язык в школе» (№ 2, 1991).
...Какие этапы проходит иноязычное слово, прежде...
...В школьной программе и учебниках русского языка не...
Кто бы ни брался за создание «расширительного» словаря того или иного типа, все непременно приходили к Далю — к этому великому человеку-словарю. Подавляющее большинство людей связывает имя Даля со знаменитым четырехтомником. Все остальное, что сделал, написал, пережил Владимир Иванович, заслонено его «Словарем».
...Кто бы ни брался за создание «расширительного...
...Весть из Вермонта В конце 1989 года в «Литературной...
Самые простые и распространенные пиктограммы могут стать источником неловкости в общении. Но и совсем отказаться от эмодзи было бы обидно — они делают наши послания и реакции более живыми, эмоциональными, облегчают контакт, помогают «не отстать от жизни». Тогда как нам ориентироваться в этом вавилонском столпотворении символов? Как общаться на языке эмодзи, не рискуя быть неправильно понятым?
...Самые простые и распространенные пиктограммы могут...
...Этот материал — часть совместного проекта Грамоты...
Найти слово сразу в нескольких словарях, сравнить результаты, проверить свою версию написания, произношения или толкования — посетители Грамоты всегда охотно пользовались этой возможностью. Но в некоторых случаях детали не нужны, а требуется, наоборот, быстро получить самое общее представление о слове. Руководитель словарного направления Грамоты Анастасия Александровна Бонч-Осмоловская объясняет, каким образом в метасловаре объединены и структурированы данные о слове и какие преимущества новый формат дает пользователям.
...Найти слово сразу в нескольких словарях, сравнить результаты...
...Метасловарь как агрегатор Задать вопрос справочной...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Ясный язык — это специальная упрощенная форма языка, для каждого языка — своя. В ней нет сложных и длинных конструкций, а слова сопровождаются простыми и наглядными картинками-пиктограммами. Чтобы создать «ясноязычную» версию текста, нужно владеть специальными навыками, ведь задача такой версии — помочь людям, которым по разным причинам трудно прочитать и понять то, что написано обычным языком.
...Ясный язык — это специальная упрощенная форма...
...Кому нужен ясный язык По мнению нейропсихолога Елены...
Что нужно, чтобы языковое явление получило статус нормативного? Почему лингвистов подозревают в безволии? Как от борьбы против любых новшеств наивные носители языка перешли к требованию узаконить собственные представления о правильном? О том, что именно общество одобряет и порицает, когда речь идет о нормах, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН Светлана Друговейко-Должанская рассказала в лекции «Наивный носитель языка и его бесценное мнение о норме». Грамота подготовила конспект этой лекции.
...Что нужно, чтобы языковое явление получило статус нормативного...
...Наивные и искушенные Выражение «наивный носитель...
Изначально этот текст, написанный лет десять назад и называвшийся «Заметки графофила», имел ограниченное хождение среди моих друзей и знакомых. Позднее бóльшая его часть под заголовком «„И пучину взворотила и поставила вверх дном“? (заметки об авторской пунктуации)» была опубликована в газете «Русский язык» (№ 7 за 2002 год). Сокращения коснулись отступления про «авторскую орфографию», а также материалов, найденных в интернете. Авторская орфография заслуживает отдельного обстоятельного разбора, текстов из интернета я и сейчас тоже почти не касаюсь.
...Изначально этот текст, написанный лет десять назад...
...За прошедшие десять лет интернет вырос многократно,...