Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Пунктуационная асимметрия — давно известная переводчикам проблема: системы знаков препинания в разных языках не совпадают ни функционально, ни стилистически. Французская пунктуация, например, традиционно более сдержанна, чем русская, где восклицательный знак может выражать не только эмоции, но и вежливость («Спасибо!», «Добрый день!»). Машинный перевод пока плохо учитывает эти тонкости, механически перенося знаки из языка в язык или ...
...Пунктуационная асимметрия — давно известная переводчикам...
Разработка стартапа Cybernet AI стала первым масштабным решением в области автоматического распознавания речи (ASR), созданным с нуля специально для тюркской языковой группы, а не адаптированным из англоязычных моделей. Большинство систем, используемых в регионе, до недавнего времени базировались на архитектурах, изначально обученных на английском языке. Такие универсальные модели плохо справлялись с фонетикой, особенностями интонации и
...Разработка стартапа Cybernet AI стала первым масштабным...
Многие из тех, кто учил иностранный язык в школе, признаются, что умеют рассуждать о мировой политике или защите окружающей среды, но теряются, когда нужно правильно назвать венчик для взбивания, определенный вид встроенного шкафа или шапочку с помпоном. В процессе перевода тоже возникают похожие трудности с конкретной лексикой, когда одним словом могут быть названы очень разные предметы. Переводчик с итальянского Анна Ямпольская рассказала Грамоте, на какие ухищрения приходится идти, чтобы отличить пиджак от куртки, а панаму от ушанки.
...Многие из тех, кто учил иностранный язык в школе, признаются...
...Как известно, костюм — одна из важнейших характеристик...
Участников опроса просили оценить свой уровень владения русским языком, спрашивали о том, на кого должна ориентироваться языковая норма (на мнение специалистов или на то, как говорит большинство жителей страны), как они относятся к изменениям правил. Среди опрошенных авторы выделили представителей шести поколений: поколение «оттепели» (до 1947), поколение «застоя» (1948–1967), реформенное поколение (1968–1981), старшие миллениалы (1982–
...Участников опроса просили оценить свой уровень...
37% участников опроса Фонда «Общественное мнение» (ФОМ) согласны с тем, что иностранные языки преподаются в большинстве общеобразовательных школ скорее плохо. У 35% нареканий нет, еще 28% затруднились с ответом. Опрос показал, что три четверти россиян (76%) не считают владение иностранными языками необходимым навыком. Больше всего разделяющих эту мысль среди опрошенных старше 60 лет (87%), а меньше всего — среди молодежи до
...37% участников опроса Фонда «Общественное мнение...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
В новом выпуске журнала «Коммуникативные исследования» наше внимание привлекли две статьи: об идиостиле в генеративном тексте и о том, как разработчики пытаются решить противоречивую задачу — сделать ИИ похожим на человека и одновременно внедрить необходимые технологические ограничения.
...В новом выпуске журнала «Коммуникативные исследования...
...Есть ли у ИИ собственный стиль? Благодаря способности...
Фразеология часто оказывается самой непонятной частью языка не только для иностранцев, но и для младших поколений, которые редко встречали и никогда не употребляли выражения вроде «семь пятниц на неделе». Многие идиомы кажутся устаревшими и ассоциируются с речью бабушек и дедушек. Но никогда не поздно разобраться, какой смысл имеют истории про белок, комаров, баранов и молочные реки, даже если вы сами использовать эти выражения не собираетесь. Мы выбрали семь идиом, которые чаще других ищут на Грамоте — и не находят! Самое время дополнить Справочник по фразеологии.
...Фразеология часто оказывается самой непонятной частью...
...Крутиться как белка в колесе Образ. Белка, которая...
У билингвов, которые изучили второй язык в раннем детстве, сетевая структура мозга устроена эффективнее. К такому выводу пришли исследователи из Монреальского неврологического института при Университете Макгилла, Оттавского университета (Канада) и Сарагосского университета (Испания). Чтобы понять суть этого вывода, стоит разобраться в том, что здесь понимается под эффективностью. Если говорить упрощенно, глобальная эффективность сети определяется тем, насколько ...
...У билингвов, которые изучили второй язык в ...