Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Про русский язык сегодня известно очень много. Чтобы сделать в русистике что-то действительно новое, хорошо бы посмотреть на описание языка радикально иначе. Такой взгляд со стороны типологии, как мне кажется, может быть продуктивным.
...Про русский язык сегодня известно очень много. Чтобы...
...Я хоть и работаю в Институте русского языка давно и...
Этот вопрос мы задали трем лингвистам, которые не только исследуют русский язык научными методами, но и общаются со студентами и поэтому имеют непосредственное представление о том, как говорит сегодня молодежь. Во время дискуссии «В поисках грамотности», которая состоялась на 37-й Московской международной книжной ярмарке в начале сентября, мы услышали опровержение многих стереотипов.
...Этот вопрос мы задали трем лингвистам, которые не только...
...Недавно в одном научном журнале нам встретились...
Русское ударение — сложнейшая система, которая ставит в тупик иностранцев. Вот что о ней говорит сам Александр Пиперски, лауреат премии «Просветитель»: «Если вы говорите красиве́е, вас обвинят в необразованности. Если вы говорите осу́жденный, вы, вероятно, работаете в прокуратуре. Если вы ловко ставите ударение то на окончание, то на корень, то на предлог, говоря рука́, ру́ку и за́ руку, вы, скорее всего, носитель русского языка и даже не задумываетесь об этом — а ...
...Русское ударение — сложнейшая система, которая...
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Грамота: Все, кто работает с языком как исследователи...
Когда-то мы смеялись над корявостью и глупостью первых языковых моделей. Сегодня чат-боты пишут за людей деловые письма и посты, сочиняют рассказы, ведут задушевные беседы и приводят аргументы в спорах. Есть ли что-то, чем речь машины в корне отличается от человеческой? И может ли эксперт — или даже другая машина — обнаружить эту разницу?
...Когда-то мы смеялись над корявостью и глупостью первых...
...Гладко, но безжизненно Машина пишет текст не ...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Цифровая коммуникация регулируется множеством неформальных правил, которые возникают на наших глазах. Мы обсуждаем время отправки сообщений, скорость реакции на них, уместность эмодзи, стикеров и скобочек, но самую важную роль играют слова. Рассказать о словесных кодах рабочих чатов Грамоте помогла Ольга Лукинова — эксперт по цифровым коммуникациям, автор телеграм-канала «Цифровой этикет».
...Цифровая коммуникация регулируется множеством неформальных...
...Чужой монастырь и корпоративная культура Цифровой...
Александр Александрович Реформатский вошел в историю отечественной лингвистики прежде всего как автор неоднократно переиздававшегося учебника для филологических вузов «Введение в языковедение». Но ему принадлежит и ряд других трудов, оставивших заметный след в науке о языке. В памяти же современников, его коллег и учеников он остался как необыкновенно колоритная и своеобразная личность, как человек, производивший на собеседников яркое впечатление не только всем своим обликом и манерой поведения, но и своей речью.
...Александр Александрович Реформатский вошел в историю...
...«А ведь так, как говорит Реформатский, не говорит...