Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Недавнее исследование, проведенное учеными из ...
Распознавание рукописных текстов — задача, где пересекаются лингвистика, история и машинное обучение. Как научить программу понимать сотни тысячи документов, созданных больше ста лет назад — да к тому же не всегда грамотными и аккуратными людьми? С этой задачей призвана справиться новая разработка специалистов Новосибирского государственного университета. Магистрант факультета информационных технологий НГУ Степан Гудков под руководством ...
...Распознавание рукописных текстов — задача...
В 2024 году Грамота предложила филологам оценить одиннадцать слов, которые удовлетворяли нашим критериям и поэтому вошли в шорт-лист «слов года». Вот эти слова: инсайт, вайб, нарратив, абьюз, аскеза, осознанность, прилет, пов, сап, скуф и нормис. Мы попробуем показать, чем интересны эти слова, а заодно ответим на самые распространенные вопросы: почему тут есть слова, которых никто не знает, почему тут есть слова, которые все давно знают, и, наконец, почему в этом списке сплошные заимствования?
...В 2024 году Грамота предложила филологам оценить...
...Неожиданный список Новые и старые Начнем, пожалуй...
К Международному дню грамотности, который отмечают 8 сентября, аналитики контентной платформы «Дзен» и исследователи Грамоты провели масштабный опрос, чтобы выяснить мнение россиян о заимствованных словах. Ответы 1323 респондентов из разных регионов страны выявили противопоставление «полезных» иностранных слов и «загрязняющих» наш язык. Особенно негативно россияне относятся к молодежному сленгу. Лидером антирейтинга стало ...
...К Международному дню грамотности, который отмечают...
Владикавказский научный центр Российской академии наук (ВНЦ РАН) начал сотрудничество с ведущими российскими ИТ-специалистами с целью расшифровки рукописей нартских сказаний с помощью искусственного интеллекта. Предварительные тесты показали обнадеживающие результаты в работе с историческими документами. В архиве рукописей центра хранится больше десяти тысяч текстов — это одна из крупнейших коллекций такого рода на Северном Кавказе. В 1930–
...Владикавказский научный центр Российской академии наук...
Короткое слово «пока» настолько нам привычно, что без него не обходится ни одно повседневное расставание близких или хорошо знакомых друг с другом людей. Но так было не всегда. Историю превращения этого маленького слова из наречия в способ неформального прощания рассказывает лингвист Ирина Фуфаева.
...Короткое слово «пока» настолько нам привычно...
...Слово пока играет в русском языке разные роли. Оно...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
В августе внимание СМИ было приковано к Аляске как к месту российско-американского саммита. Как известно, в 1867 году российский император Александр II продал Аляску американцам, но там до сих пор живут люди, говорящие на особом диалекте русского языка. Русскоязычные жители Аляски тесно взаимодействовали с коренным населением, и местные индейцы переняли многие православные традиции. Об этом и многом другом лингвист Андрей Кибрик рассказал в интервью «Российской газете».
...В августе внимание СМИ было приковано к Аляске как...
...На Аляске около двадцати коренных языков, которые...
Отчество — вторая из трех составляющих традиционного полного наименования человека в русском языке. Такой элемент есть не во всех культурах, что делает отчество важной частью русского культурного кода и привлекает к нему повышенное внимание. В каких ситуациях употребление отчества будет проявлением уважения, а в каких — фамильярностью? И можно ли сказать, что отчества постепенно исчезают из нашей речи?
...Отчество — вторая из трех составляющих...
...Когда появились Отчество — часть родового...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...В середине сентября Робин Спир, создательница проекта...