Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...
Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Недавнее исследование, проведенное учеными из ...
С помощью новой технологии тексты цифрового «Яндекс.Учебника» сравнили с другими школьными пособиями по русскому языку. Выяснилось, что в цифровом учебнике меньше агрономов и березок, зато больше программистов и бабушек. Но есть и более глубокие отличия, говорится в публикации на сайте «Системный Блокъ».
...С помощью новой технологии тексты цифрового «...
...Методика заключается в том, что во всей совокупности...
В середине апреля открытая интернет-энциклопедия «Рувики» объявила о добавлении разделов на бурятском, вепсском, ингушском, калмыцком, коми, коми-пермяцком, ливвиковском (часть лингвистов относит его к диалекту карельского языка) и хакасском языках. Согласно пресс-релизу, таким образом проект поддерживает работу по сохранению языков народов России. Ранее в «Рувики» были добавлены одиннадцать разделов на языках народов, живущих в
...В середине апреля открытая интернет-энциклопедия...
Стартап Metamentor, основанный студентами МФТИ, создал систему обработки рукописей на базе генеративного искусственного интеллекта. Система уже несколько месяцев тестируется в издательстве «Эксмо». «Алгоритмы анализируют синтаксическую сложность каждого произведения, разнообразие лексики, распознают фрагменты текста, требующие корректировки, исключения или добавления возрастной маркировки в соответствии с действующим законодательством ...
...Стартап Metamentor, основанный студентами МФТИ...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Сегодня специалисты согласны в том, что сложные системы коммуникации есть не только у людей. Понимание того, как общаются животные, может дать представление об их социальных структурах и поведении и улучшить жизнь одомашненных видов. Прогресс в этом направлении обеспечивают нейросети, которые анализируют большие объемы информации и находят неочевидные закономерности. Исследователи из канадского Университета Далхаузи использовали методы обработки естественного языка ...
...Сегодня специалисты согласны в том, что сложные...
С 1 апреля вступил в силу закон, обязывающий детей иностранных граждан и лиц без гражданства подтверждать знание русского языка для поступления в российские школы. Одновременно была запущена процедура тестирования детей. Диагностические материалы разработал Федеральный институт педагогических измерений (ФИПИ). Для детей, поступающих в первый класс, предусмотрена только устная часть, начиная со второго класса добавляется письменная. Потенциальному первокласснику предложат ответить на ...
...С 1 апреля вступил в силу закон, обязывающий детей...
Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) завершили разработку уникальной системы распознавания речи для ливвиковского наречия карельского языка, сообщает ТАСС. По данным ученых, в мире на карельском говорят около 30 тысяч человек, из которых 25 тысяч живут в России. При этом в повседневном общении его используют лишь 5–7 тысяч носителей. «Изучение карельского имеет огромное значение не только для сохранения культурного ...
...Специалисты Санкт-Петербургского федерального исследовательского...
Техническая документация наверняка была еще во времена Промышленной революции: любой станок требует хотя бы краткой инструкции по работе с ним. Но в компьютерную эпоху разнообразие и обилие программ, систем и устройств, которые надо описывать, привело к созданию нового функционального стиля речи со своей лексикой и фразеологией. Как вырабатывался этот стиль и какими качествами должно обладать удачное техническое описание, Грамоте рассказал технический писатель, один из авторов соответствующего профессионального стандарта Михаил Острогорский.
...Техническая документация наверняка была еще во времена...
...Придумать жанр Когда я только начинал заниматься технической...