Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Михаил Копотев о роли сгенерированных нейросетью текстов...
...Нейросети учатся на текстах, созданных человеком. Но...
...Перевод инструкций для бытовой техники — хороший пример такого рода. Лет двадцать назад еще существовали технические переводчики, которые обладали уникальными знаниями: они знали названия всех частей стиральной машины....
...Сейчас эта работа полностью автоматизирована: она шаблонна, текстов такого рода очень много, а инструкций пользователи все равно не читают. В последние пару лет я редко пишу письма сам — чаще я говорю модели, что, в каком стиле и на каком языке ответить....
...Обучение и самообучение: как синтетические данные влияют...
Заметки Бориса Самойловича Шварцкопфа посвящены цитации как лингвистическому явлению, связанному с закономерностями функционирования языка. Автор рассматривает на многочисленных литературных и публицистических примерах виды цитат, их роль в тексте, особенности их оформления.
...Противопоставление элемента и контекста...
...Заметки Бориса Самойловича Шварцкопфа посвящены...
...А нельзя ли и к фактам такого рода подойти с точки зрения широко понимаемой проблемы цитации?...
... Такого рода тенденция характерна, например, для фельетона и научно-популярной литературы: в первом стилистическим противопоставлением достигается комический эффект29, во второй — так называемое «оживление» текста с помощью разговорно-просторечных элементов....
...О некоторых лингвистических проблемах, связанных с...
О начале разработки сообщил марийский лингвист, научный сотрудник Марийского института языка, литературы и истории Андрей Чемышев. Проекту уже дали название «iВика», созвучное с марийским женским именем Айвика. В целом набор функций цифрового помощника будет таким же, как у других подобных продуктов: он сможет найти информацию в интернете и зачитать ее, добавить встречу в календарь, включить песню, рассказать сказку или анекдот. Изюминка — в языке. Колонки с ...
...Голосовой помощник сможет отвечать на вопросы, искать...
...Это не первая инициатива такого рода. Ранее программист Айгиз Кунафин объявил о проекте башкироязычной умной колонки под названием «Һомай». Первые опытные образцы уже созданы. Кунафин пообещал поделиться опытом с коллегами....
...В Марий Эл разрабатывают умную колонку, говорящую на...
Каждый день мы сталкиваемся с огромным количеством больших и маленьких текстов, но не всегда нам удается сразу осознать прочитанное. Что такое читательская грамотность и почему ее важно развивать? Грамота публикует статью нашего партнера, Всероссийского чемпионата сочинений «Своими словами», которая помогает увидеть сбои в логике, фантазии, преувеличения и неправомерные обобщения там, где при обычном чтении мы не замечаем ничего подозрительного.
...Чтобы лучше понимать прочитанное, нужно развивать читательскую...
...Каждый день мы сталкиваемся с огромным количеством...
...Иногда такого рода ошибки используют не ради смеха, а для введения в заблуждение тех, кто их не распознаёт. Таким образом действует большинство авторов фейковых новостей — одновременно обращаясь к механизмам когнитивных искажений и используя логические ошибки....
...Критический взгляд на текст: как увидеть искажения...
«О составлении „Этимологического словаря русского языка“ как о главной цели своей научной деятельности я мечтал еще во время первых исследований, посвященных влиянию греческого языка на славянские (1906-1909), — писал Макс Фасмер о своем труде. — Многие пожелания, высказанные в рецензиях на мой словарь, несомненно, будут полезными для последующего русского этимологического словаря, в котором должно быть уделено особое внимание многочисленным словам, названным здесь неясными. Если бы мне пришлось начать работу снова, я уделил бы большее внимания калькам и семасиологической стороне».
...Очерк жизни и деятельности...
...«О составлении „Этимологического словаря...
...Можно предположить возможность трех подходов к осуществлению предприятия такого рода: 1) «механический» перевод при полном «фотографическом» невмешательстве в оригинальный текст с неизбежным повторением авторских огрехов; 2) переделка авторского текста по усмотрению переводчика...
...Макс Фасмер как филолог русской школы...
Большую часть своей жизни в науке я занималась теоретической фонетикой и фонологией, развивая идеи Московской фонологической школы. Но в последние годы я увлеклась проблемами кодификации произносительных норм. И есть один аспект, связанный с произносительными рекомендациями в орфоэпических словарях, который меня и тревожит, и раздражает, — это отсутствие данных о процедуре принятия кодификационных решений, положенных в основу того или иного словаря.
...Что волнует русистов сегодня? Опрос Грамоты...
...Большую часть своей жизни в науке я занималась теоретической...
...И такого рода примеров можно привести без преувеличения тысячи и тысячи. Создается впечатление, что кодификаторы боятся отступить от традиции и изменить словарные рекомендации, предпочитая сохранять status quo....
...Мария Каленчук: «Нормативные рекомендации должны опираться...
Живучесть словесных игр, переходящих из поколения в поколение, свидетельствует об их необходимости для умственного развития детей. Играя, они тренируют умение быстро вспоминать и точно употреблять нужные слова по заданным признакам, то есть активно владеть своим словарным багажом.
...Обучающие игры со словами: непроверяемые написания...
...Живучесть словесных игр, переходящих из поколения в...
...После звонка оказалось, что школьники не пошли на перемену: они толпились у доски, продолжая увлеченно подбирать и записывать слова: банан, караван, Каштанка… Задания такого рода были введены в постоянный учебный обиход. Например, такие....
...Чтобы добыть драгоценное слово…...
Предлагаем вниманию читателей портала статью, опубликованную в журнале «Русский язык в школе» (№ 3, 1954). Чем отличаются друг от друга историзмы и архаизмы, в чем разница между лексическими и семантическими архаизмами? С какой целью их используют писатели? На эти вопросы отвечает Николай Максимович Шанский, с 1963-го по 2005 год — главный редактор журнала.
...Николай Максимович Шанский о сложных процессах архаизации...
...Предлагаем вниманию читателей портала статью, опубликованную...
...С одной стороны, исследуя язык писателя прошлого, мы встречаемся с сознательным использованием такого рода фактов в определенных, указанных выше стилистических целях....
...К такого рода устаревшим словам можно отнести слова: конка, боярин, аршин, камер-юнкер, городовой, трактирщик, брадобрей, токмо (только), глаголать (говорить), зело (очень), живот (жизнь), вран (ворон) и др....
...Вот, например, некоторые архаизмы такого рода, наблюдаемые в романе Пушкина «Евгений Онегин»: соседственной, остановляет, покорствуя, кокетствуя, балтическим (ср. соседней, останавливает, покоряясь, кокетничая, балтийским)....
...Устаревшие слова в лексике современного русского литературного...
На первый взгляд теоретические вызовы, стоящие перед современной лингвистической наукой, бесконечно далеки от проблем школьного русского. Но если предложить школьникам задуматься над почему-вопросами об устройстве языка, это расширит их научную картину мира и сделает освоение родного языка более увлекательным, считает доктор филологических наук, заведующий кафедрой теоретической и прикладной лингвистики филологического факультета МГУ Сергей Георгиевич Татевосов.
...Доклад лингвиста Сергея Татевосова на Международном...
...На первый взгляд теоретические вызовы, стоящие перед...
...В теоретической лингвистике второй половины XX и начала XXI века произошел лавинообразный рост такого рода вопросов, и лингвисты сосредоточили свои усилия на том, чтобы найти ответы на них....
...Что лингвистическая теория может дать школьному образованию...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Комментарии участников проекта...
...Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей....
...Состоялся запуск масштабного цифрового проекта «Слово...