Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Представьте, что мы создаем электронного ассистента...
...задачу: Вот тысяча учебных текстов, в которых мы...
... — создай еще миллион похожих, и тогда мы...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...Мы не попадаем своими логическими конструкциями в словесную...
...Мы задались вопросом: действительно ли пометы и символы...
...На сегодняшний день мы сделали первые шаги в области...
Наталья Мавлевич — переводчик с французского, преподаватель, ученица Лилианны Лунгиной — рассказала «Арзамасу» о детстве, учебе в университете, первых работах и первых переводах. Мы выбрали несколько цитат из этого разговора.
...Наталья Мавлевич — переводчик с французского,...
...Чем мы занимались?...
...Мы переводили фразы, которые она нам давала....
...Мы занимались раз в две недели, и каждый, чей...
5 октября — Международный день осведомленности о дислексии. В этот и последующие дни педагоги, психологи, логопеды, родители обсуждают трудности в обучении, связанные с дислексией и дисграфией, и методики, которые помогают детям преодолеть эти трудности. О том, как сейчас устроена помощь детям, которым сложно читать и писать, мы расспросили Ольгу Величенкову, кандидата педагогических наук, эксперта Ассоциации родителей детей с дислексией, руководителя онлайн-проекта «Школьные технологии».
...5 октября — Международный день осведомленности...
...Грамота: Что мы сейчас знаем о природе трудностей...
...Понятно, что мы читаем ради смысла....
...Мы просто не смогли этих детей хорошо научить....
По случаю обновления Грамоты мы решили напомнить нашим читателям, как появился этот интернет-ресурс, как он развивался и в чем всегда оставался верен себе. Об основных вехах долгой истории Грамоты расскажет свидетель и один из главных участников событий, научный сотрудник Института русского языка им. В. В. Виноградова РАН, многолетний главный редактор, а ныне научный руководитель Грамоты Владимир Маркович Пахомов.
...По случаю обновления Грамоты мы решили напомнить нашим...
...Днем рождения нашего портала мы называем 14 ноября...
...формат интерактивного диктанта, а два года спустя мы...
...В том же 2005 году мы поучаствовали в подготовке и...
Прошел уже почти год после обновления портала, и мы решили поговорить с нашими пользователями об их впечатлениях: расспросить их, как они взаимодействуют с Грамотой, что им нравится, что раздражает, а что, наоборот, полезно и удобно. Мы благодарны всем ответившим: нам было важно узнать мнение тех, для кого мы работаем.
...Прошел уже почти год после обновления портала, и ...
...Потом мы открыли Грамоту, посмотрели и быстро...
... Мы регулярно проводим общередакционные встречи...
...В дискуссии мы используем разные аргументы, в&...
Язык дарит свободу общения, но при этом предлагает ограниченный набор звуков, слов и грамматических конструкций. В основе этого парадокса лежит удивительная способность языка наделять уже знакомые слова новыми значениями и ассоциациями. Один из механизмов, которые связывают речь и мышление, — метафора. О том, где мы можем заметить работу этого механизма, рассказывает лингвист Валерий Шульгинов.
...Язык дарит свободу общения, но при этом предлагает...
...Мы регулярно используем выражения вроде выйти из себя...
...Эти фразы для нас настолько естественны, что мы не...
...Представление, в соответствии с которым мы видим будущее...
Цифровая коммуникация регулируется множеством неформальных правил, которые возникают на наших глазах. Мы обсуждаем время отправки сообщений, скорость реакции на них, уместность эмодзи, стикеров и скобочек, но самую важную роль играют слова. Рассказать о словесных кодах рабочих чатов Грамоте помогла Ольга Лукинова — эксперт по цифровым коммуникациям, автор телеграм-канала «Цифровой этикет».
...Цифровая коммуникация регулируется множеством неформальных...
...В сетевом общении мы вступаем на зыбкую почву....
...Особенно остро мы это чувствуем в новой группе...
...Вводная объясняющая формула: Мы в прошлом году...
Мы с несколькими коллегами работаем над новым двуязычным русско-немецким и немецко-многоязычным (в том числе русским) онлайн-словарем синтаксических фразеологизмов. В течение следующего года мы планируем достичь объема триста словарных статей по каждому из двух языков и опубликовать первую версию словаря, но будем продолжать над ним работать и его пополнять.
...Мы с несколькими коллегами работаем над новым двуязычным...
... В работе мы используем русско-немецкую базу...
...На основе этой базы данных мы разрабатываем новый двуязычный...
...В дальнейшем мы планируем увеличить число параметров...
О том, как усовершенствовать отечественную рекламу и кто в состоянии это обеспечить, рассказывает генеральный директор Рекламного совета России, председатель комитета по рассмотрению обращений и практике применения норм саморегулирования и законодательства Дмитрий Степанович Бадалов.
...О том, как усовершенствовать отечественную рекламу...
...Мы обязательно должны это делать, но при этом мы должны...
...Мы говорим: «Вот все, что мы можем сделать»...
...Причем мы его сделали в довольно жесткой форме, мы...