Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В прошлом году мы уже анализировали несуществующие слова, которые наши читатели пытались найти на портале, и хотим продолжить эту традицию. Наши коллеги выбрали для нас самые удивительные запросы пользователей, а мы попробовали пофантазировать, как возникли эти слова и что они могли бы значить.
...В прошлом году мы уже анализировали несуществующие...
...Под окказионализмами обычно понимают слова, которые...
Выбором «слова года» занимаются авторитетные словари, языковые институты, газеты и сайты. С недавнего времени такую акцию проводит и Грамота. Чем отличается наш подход к определению «слова года»? Как мы собираем данные, фильтруем и оцениваем их? Приоткрываем дверь на нашу социолингвистическую кухню. И предупреждаем: у большого «слова года» будет свита из «главных слов» в разных сферах.
...Выбором «слова года» занимаются авторитетные...
...Вторые «выборы»: развиваем методологию...
Что такое языковая норма? Почему нам важно говорить правильно? Как понять, когда следует твердо стоять на страже старой нормы, а когда уже можно «допустить» новый вариант произношения слова? На эти и другие вопросы Грамоты ответил кандидат филологических наук, доцент кафедры стилистики русского языка факультета журналистики МГУ и лауреат Ломоносовской премии за педагогическую деятельность Михаил Штудинер.
...Что такое языковая норма? Почему нам важно говорить...
...Как у вас возникла идея создать «Словарь трудностей...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...Получившая громкую известность аббревиатура GPT расшифровывается...
Оценка языковой доступности учебных текстов для школьников сегодня не опирается на четкие критерии и прозрачную методологию. Так быть не должно, считает Антонина Лапошина — кандидат педагогических наук, специалист по компьютерной лингвистике из Института Пушкина. Она рассказала Грамоте о том, какие методы оценки текста есть в распоряжении экспертов и чем они могут быть полезны и школьникам, и авторам учебников.
...Оценка языковой доступности учебных текстов для школьников...
...Грамота: Какие проблемы должна решать лингвистическая...
Что нужно, чтобы языковое явление получило статус нормативного? Почему лингвистов подозревают в безволии? Как от борьбы против любых новшеств наивные носители языка перешли к требованию узаконить собственные представления о правильном? О том, что именно общество одобряет и порицает, когда речь идет о нормах, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН Светлана Друговейко-Должанская рассказала в лекции «Наивный носитель языка и его бесценное мнение о норме». Грамота подготовила конспект этой лекции.
...Что нужно, чтобы языковое явление получило статус нормативного...
...Наивные и искушенные Выражение «наивный носитель...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Соглашаясь с необходимостью законодательного регулирования вопросов, связанных с государственным языком, лингвисты обращают внимание на необходимость уточнения положений закона о государственном языке РФ. Некоторые из них называют отправленный на доработку закон антинаучным, дилетантским и антижурналистским, другие принципиально выступают против законодательного регулирования словоупотребления.
...Соглашаясь с необходимостью законодательного регулирования...
...Текст закона требует уточнений Юрий Караулов ...
Дать лингвистический комментарий проекта федерального закона о государственном языке — задача не из простых. Да, такой закон, безусловно, нужен. Но каковы его цели, в чем состоит, так сказать, его сверхзадача? Как должен быть сформулирован закон о языке, чтобы он не превратился в пустую бумажку или широковещательную и неконкретную декларацию? Вопросы, вопросы...
Доктор филологических наук Лев Скворцов анализирует текст проекта закона о государственном языке для «Литературной газеты».
...Дать лингвистический комментарий проекта федерального...
...О работе над этим законом я от своих коллег-филологов...