Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Наши представления о Древней Руси во многом сформированы «Повестью временных лет», которая не всегда может служить достоверным историческим источником. Споры о роли скандинавов в создании древнерусского государства продолжались веками. Недостаток источников создал почву для развития псевдоисторических идей и любительской лингвистики. Но того, что известно исследователям, достаточно, чтобы проследить судьбу важных русских корней рус- и рос-.
...Наши представления о Древней Руси во многом сформированы...
...Этимология: фантазии и факты Наверняка многие слышали...
Прежде всего приношу свои извинения за то, что вынесла в заголовок слово, которое тонкому слуху просвещенного читателя может показаться оскорбительным. На самом деле никакого отношения к некоему естественному физиологическому процессу эта лексическая единица не имеет, а вот к теме «Язык и Рунет» тяготеет самым наинепосредственнейшим образом. Ибо данное слово в лексиконе юного поколения, погрузившегося в дебри Интернета, означает всего лишь персональный компьютер.
...Прежде всего приношу свои извинения за то, что вынесла...
...Общеизвестно, что на английском языке personal computer...
Есть целый ряд фамилий, которые образованы от имен нарицательных: Соловей, Турок, Стрелец, Заяц, Рыбачок, Лев и многие другие. Во многих случаях у носителей русского языка возникает затруднение — нужно ли их склонять? И если да, то как именно: Скитальца или Скиталеца, Орленка или Орленока? Ответ на этот вопрос не столь однозначен, как может показаться.
...Есть целый ряд фамилий, которые образованы от имен...
...Почему возникают затруднения В справочную службу Грамоты...
Среди традиционно спорных вопросов перевода — вопрос о том, допустимо ли вторгаться в структуру фраз оригинала. Искусство в этом, как и в других вопросах, вроде соотношения точности и свободы в переводе, состоит в том, чтобы умело лавировать между двумя крайностями. Как именно происходит непростой выбор формы и какими соображениями руководствуются переводчики, рассказывает переводчик с французского Наталья Мавлевич.
...Среди традиционно спорных вопросов перевода &mdash...
...Надо ли подстригать фразы оригинала, как деревья в&...
Английский термин Tone of Voice (сокращенно ToV) обозначает ту интонацию, которую улавливает в тексте читатель. Этот термин пришел из маркетинга и сначала касался только бизнес-коммуникаций, голоса бренда. Затем он стал применяться к любым видам коммуникаций с аудиторией, в том числе и к тому, как государство говорит с гражданами. И, наконец, сблизился с тем, что понимается на школьных уроках литературы под «образом автора». Как устроен этот образ и что может сделать пишущий, чтобы тональность текста попала в цель?
...Английский термин Tone of Voice (сокращенно ToV) обозначает...
...Образ автора, неуловимый и вездесущий ToV описывает...
Соглашаясь с необходимостью законодательного регулирования вопросов, связанных с государственным языком, лингвисты обращают внимание на необходимость уточнения положений закона о государственном языке РФ. Некоторые из них называют отправленный на доработку закон антинаучным, дилетантским и антижурналистским, другие принципиально выступают против законодательного регулирования словоупотребления.
...Соглашаясь с необходимостью законодательного регулирования...
...Текст закона требует уточнений Юрий Караулов ...
Грамота спросила диалектолога и фонетиста Игоря Исаева, где в России можно услышать самые необычные диалекты, что влияет на их сохранность и кто из информантов ему запомнился за многие годы работы в экспедициях.
...Грамота спросила диалектолога и фонетиста Игоря...
...Грамота: Когда вы впервые столкнулись с диалектной...
Кажется, что машины начали вести с нами диалог совсем недавно. На самом деле их история насчитывает несколько десятилетий. Сам термин «чат-бот» появился в 1994 году — его предложил компьютерный инженер Майкл Молдин. А идея программного обеспечения, способного взаимодействовать с людьми на естественном языке, родилась гораздо раньше. Грамота рассказывает о том, как разработчики в разные годы пытались научить бездушные машины общаться по-человечески.
...Кажется, что машины начали вести с нами диалог...
...Работа по сценарию Разработчики будущих чат-ботов...
В 2024 году Грамота выбирала слово года в несколько этапов, опираясь на три источника данных: предложения наших пользователей, статистику (запросы на портале, данные поисковых систем и нашего партнера СКАН-Интерфакс) и голосование лингвистов. В первый список кандидатов вошли многие популярные слова, в итоге не попавшие в шорт-лист. Мы решили посмотреть, как сложилась судьба самых заметных слов прошлого года: подтверждают ли новые данные наш выбор?
...В 2024 году Грамота выбирала слово года в несколько...
...Финалисты и неудачники Напомним прошлогодний...