Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В последние годы государство уделяет большое внимание языковой политике и законодательству о языке. Были приняты поправки к закону «О государственном языке», идет работа над созданием Национального словарного фонда, утверждена Концепция государственной языковой политики, есть программы сохранения языкового разнообразия России. Какие проблемы сейчас стоят перед обществом, если говорить о русском языке? Каким образом можно было бы эффективно повысить речевую культуру жителей страны? Об этом нам рассказал руководитель Грамоты, член Совета при президенте РФ по русскому языку Константин Деревянко.
...В последние годы государство уделяет большое внимание...
...Грамота: Вы уже много лет занимаетесь издательскими...
«О составлении „Этимологического словаря русского языка“ как о главной цели своей научной деятельности я мечтал еще во время первых исследований, посвященных влиянию греческого языка на славянские (1906-1909), — писал Макс Фасмер о своем труде. — Многие пожелания, высказанные в рецензиях на мой словарь, несомненно, будут полезными для последующего русского этимологического словаря, в котором должно быть уделено особое внимание многочисленным словам, названным здесь неясными. Если бы мне пришлось начать работу снова, я уделил бы большее внимания калькам и семасиологической стороне».
...«О составлении „Этимологического словаря...
...Известный ученый-славист В. Кипарский, пытаясь...
Английский термин Tone of Voice (сокращенно ToV) обозначает ту интонацию, которую улавливает в тексте читатель. Этот термин пришел из маркетинга и сначала касался только бизнес-коммуникаций, голоса бренда. Затем он стал применяться к любым видам коммуникаций с аудиторией, в том числе и к тому, как государство говорит с гражданами. И, наконец, сблизился с тем, что понимается на школьных уроках литературы под «образом автора». Как устроен этот образ и что может сделать пишущий, чтобы тональность текста попала в цель?
...Английский термин Tone of Voice (сокращенно ToV) обозначает...
...Образ автора, неуловимый и вездесущий ToV описывает...
Предлагаем вниманию читателей портала статью Рубена Александровича Будагова, опубликованную в журнале «Русский язык в школе» (№ 2, 1968). В ней описаны разные версии происхождения слов-омонимов «мандарин», их судьба в разных языках, а также французское выражение «убить мандарина» и его связь с этическим выбором, описанным в романе Достоевского «Преступление и наказание».
...Предлагаем вниманию читателей портала статью Рубена...
...Предисловие «Грамоты.ру» Рубен Александрович...
Разные словари необходимы для разных задач. Какими-то пользуются только специалисты, другие нужны тем, кто так или иначе работают с языком, — учителям, школьникам, студентам, редакторам, публицистам. Расскажем о пяти самых востребованных типах словарей для широкого круга пользователей: толковом, орфографическом, словаре ударений, двуязычном и словаре синонимов.
...Разные словари необходимы для разных задач. Какими-то...
...Изначально словари были рукописными, малого объема...
Оценивая состояние языка, необходимо разграничивать три вида процессов: 1) в условиях функционирования языка; 2) в построении текста; 3) в системе языка. Раскрепощение, возможность свободно выражать свои мысли и чувства, игры с языком и при помощи языка — вот что характерно для русского языка нашего времени.
...Оценивая состояние языка, необходимо разграничивать...
...В последние десятилетия особенно резко изменились...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Сериал «Слово пацана», который активно обсуждают уже почти два месяца, заинтересовал нас не только словом «чушпан», которое даже называли в качестве кандидата на роль слова года. Насколько точно на экране передан сленг улицы в целом? Грамота поговорила об этом Шамилем Идиатуллиным, который в 1980-е годы жил в городе Брежнев (ныне Набережные Челны) и написал об этом времени книгу.
...Сериал «Слово пацана», который активно...
...В «Слове пацана» есть хорошая фактическая...
Тема театра в поэзии конца ХХ века возникает в соответствии с провозглашением установки на игру как творческого метода. Так или иначе она звучит в текстах-манифестах поэтов-метареалистов Ивана Жданова («До слова»), Сергея Соловьева («Амфитеатр печатной машинки...») и Алексея Парщикова («Вступление»).
...Тема театра в поэзии конца ХХ века возникает...
...Все эти тексты обнаруживают как схождения между собой...