повре | Журнал | Поиск по Грамоте

Искусственный интеллект поможет расшифровать рукописи нартских сказаний

Владикавказский научный центр Российской академии наук (ВНЦ РАН) начал сотрудничество с ведущими российскими ИТ-специалистами с целью расшифровки рукописей нартских сказаний с помощью искусственного интеллекта. Предварительные тесты показали обнадеживающие результаты в работе с историческими документами. В архиве рукописей центра хранится больше десяти тысяч текстов — это одна из крупнейших коллекций такого рода на Северном Кавказе. В 1930–

...Владикавказский научный центр Российской академии наук...

Российские лингвисты научили алгоритм правильно «переводить» знаки препинания

Пунктуационная асимметрия — давно известная переводчикам проблема: системы знаков препинания в разных языках не совпадают ни функционально, ни стилистически. Французская пунктуация, например, традиционно более сдержанна, чем русская, где восклицательный знак может выражать не только эмоции, но и вежливость («Спасибо!», «Добрый день!»). Машинный перевод пока плохо учитывает эти тонкости, механически перенося знаки из языка в язык или ...

...Пунктуационная асимметрия — давно известная переводчикам...

Иноязычная стихия современной русской речи

Использование иностранных слов в современной российской жизни абсолютно закономерно и связано с прогрессом. Но не всякое значение употребляемых иностранных слов понятно, особенно для массового восприятия. Прежде всего это относится к узкопрофессиональным словам. Впрочем, неясными порой оказываются слова, политически и экономически предназначенные для активного употребления в самых широких слоях.

...Использование иностранных слов в современной российской...

...Русская речь в последнее время пополнилась и ...

Прогноз: текстовые данные для обучения нейросетей могут закончиться в ближайшие годы

В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...

...В течение многих лет такие компании, как OpenAI...

Компания Alibaba представила собственный ИИ-переводчик для международной торговли

Международная торговая компания Alibaba International Digital Commerce (AIDC) Group, известная как Alibaba, анонсировала запуск новой большой языковой модели Macro MT, разработанной специально для переводов в сфере международной торговли. Решение создать такой сервис в компании приняли после того, как обнаружили, что существующие инструменты перевода не учитывают в полной мере культурные особенности текстов. Модель будет встроена в системы управления ...

...Международная торговая компания Alibaba International...

Исследование: словарный запас играет важную роль в выборе партнера

Новое исследование, опубликованное в научном журнале Languages, утверждает: объем словарного запаса будущего партнера может быть фактором, определяющим перспективность отношений с ним. Исследователи проанализировали данные 83 двуязычных (английско-турецких) пар, состоящих в браке более 15 лет. Они были отобраны из более широкой выборки, использованной в предыдущем исследовании тех же авторов, посвященном изучению связей между словарным запасом родителей и

...Новое исследование, опубликованное в научном журнале...

Просодия образует отдельную знаковую систему, похожую на язык

Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...

...Системы распознавания речи работают с последовательностью...

Ольга Крючкова: «Работа по сбору и сохранению диалектной речи — это историческая миссия лингвистов»

Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.

...Наша кафедра теории, истории языка и прикладной лингвистики...

...Диалектный корпус позволяет ставить и решать новые...

Чем опасны «бесы орфографии»?

Многим кажется, что школьного курса вполне достаточно, чтобы рассуждать обо всех вопросах, связанных с русским языком. Конечно, это не так. Конспирологические мифы и антинаучные интерпретации фактов приходится опровергать лингвистам. Среди подобных предрассудков — отказ признавать приставку бес-. Лингвист Алексей Лебедев считает, что бояться тут совершенно нечего.

...Многим кажется, что школьного курса вполне достаточно...

...Лингвистическая темнота В школе, к сожалению, не преподают...

Языковые модели хуже обрабатывают середину текста

Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...

...Исследователи из Массачусетского технологического...

Почитать на грамоте