Международная торговая компания Alibaba International Digital Commerce (AIDC) Group, известная как Alibaba, анонсировала запуск новой большой языковой модели Macro MT, разработанной специально для переводов в сфере международной торговли. Решение создать такой сервис в компании приняли после того, как обнаружили, что существующие инструменты перевода не учитывают в полной мере культурные особенности текстов. Модель будет встроена в системы управления ...
...Международная торговая компания Alibaba International...
Специалисты Санкт-Петербургского федерального исследовательского центра РАН (СПб ФИЦ РАН) завершили разработку уникальной системы распознавания речи для ливвиковского наречия карельского языка, сообщает ТАСС. По данным ученых, в мире на карельском говорят около 30 тысяч человек, из которых 25 тысяч живут в России. При этом в повседневном общении его используют лишь 5–7 тысяч носителей. «Изучение карельского имеет огромное значение не только для сохранения культурного ...
...Специалисты Санкт-Петербургского федерального исследовательского...
Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...
...Системы распознавания речи работают с последовательностью...
Сага «Звездные войны» давно стала культурным феноменом. При этом использование имен и понятий, присущих именно этой киновселенной, распространилось далеко за пределы фанатского сообщества. Сотрудница Хемницкого технического университета Кристина Санчес-Стокхаммер проверила, как терминология «Звездных войн» повлияла на современный английский язык. Ее интересовала частота появления выбранных ею слов в четырех разных корпусах английского языка, в том числе в Британском ...
...Сага «Звездные войны» давно стала культурным...
Сайт bioRxiv, на котором биологи выкладывают нерецензированные версии (препринты) своих статей, с ноября начал использовать ИИ-модель для создания краткого описания этих текстов. «Выжимки» публикаций на bioRxiv создаются на основе большой языковой модели, разработанной компанией ScienceCast. Краткие описания на bioRxiv основаны на тексте статьи, а не только аннотации к ней. По словам разработчиков, это позволит ученым быстрее и эффективнее принимать решение, стоит ли читать ...
...Сайт bioRxiv, на котором биологи выкладывают нерецензированные...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Ключевые слова в научных статьях, монографиях и других текстах нужны для того, чтобы потом по этим словам публикация могла быть отнесена к определенной теме и нашлась в поиске. Было бы удобно «вычислять» ключевые слова с помощью нейросетевых алгоритмов, которые автоматически прочитывают текст и определяют, о чем там идет речь. Сейчас подходы к определению ключевых слов в основном строятся на выделении их из текста. Однако в этом ...
...Ключевые слова в научных статьях, монографиях...
Фразеологизм — это устойчивое выражение, значение которого не сводится к сумме значений его компонентов. Как лингвокультурология изучает фразеологию, чем русские идиомы отличаются от идиом других языков и как они себя чувствуют в эпоху мемов и эмодзи? Об этом Грамоте рассказала доктор филологических наук, главный научный сотрудник Института языкознания РАН Мария Ковшова.
...Фразеологизм — это устойчивое выражение,...
...Даже огурец может быть символом Лингвокультурология...
Конгресс приурочен к Году педагога и наставника в России и станет главным событием IV съезда Общества русской словесности. 9 ноября состоится пленарное заседание и награждение победителей Международного конкурса «Учитель и его ученики на пространстве СНГ», посвященного двухсотлетию со дня рождения Константина Ушинского и Году русского языка как языка межнационального общения в СНГ. На 10–11 ноября намечены основные мероприятия конгресса, в том числе: Съезд учителей и ...
...Конгресс приурочен к Году педагога и наставника в России...