Распознавание рукописных текстов — задача, где пересекаются лингвистика, история и машинное обучение. Как научить программу понимать сотни тысячи документов, созданных больше ста лет назад — да к тому же не всегда грамотными и аккуратными людьми? С этой задачей призвана справиться новая разработка специалистов Новосибирского государственного университета. Магистрант факультета информационных технологий НГУ Степан Гудков под руководством ...
...Распознавание рукописных текстов — задача...
Поздравляем наших друзей, подписчиков и партнеров с наступающим Новым годом! Уходящий год был насыщенным и интересным. Грамота в третий раз выбрала слово года — нам нравится эта новая традиция. В один ряд с нейросетью (2023) и вайбом (2024) встал зумер — слово 2025 года по мнению наших экспертов. Но и Грамота тоже «зумер» — нам исполнилось 25 лет. Все эти годы мы стремились создать пространство любви к русскому языку и культуре. Мы благодарны ...
...Поздравляем наших друзей, подписчиков и партнеров...
Многие слышали о том, что у северных народов есть десятки слов для обозначения снега. Но из чего складывается такая пестрая картина? В новом исследовании лингвиста Егора Николаева из Института гуманитарных исследований СО РАН (Якутск) подробно описывается, как устроена «снежная» лексика якутского языка. Оказывается, названия снега могут быть связаны не только с его физическими свойствами (например, влажностью), но и с повадками ...
...Многие слышали о том, что у северных народов...
С 1 января в России вступил в силу новый Общероссийский классификатор профессий рабочих, должностей служащих и тарифных разрядов. В последний раз такой документ публиковали в 1994 году (в 2012-м в него внесли ряд изменений) — с тех пор появились десятки новых специальностей, в том числе и в сфере работы с текстами. Новая версия легализует позиции, которые раньше в трудовых книжках маскировались под расплывчатыми ...
...С 1 января в России вступил в силу...
Книжный сервис «Литрес» проанализировал читательскую активность россиян в 2025 году. Выводы: интерес к чтению растет, причем в основном в регионах. Наши соотечественники стали уделять чтению на 10% больше времени, чем годом ранее. В авангарде этого тренда оказалась Магаданская область, жители которой стали самыми активными читателями в стране. В топ-10, согласно методологии учета времени в активные дни чтения, вошли ...
...Книжный сервис «Литрес» проанализировал...
Носители языка не всегда могут уследить за тем, что лингвисты тщательно фиксируют в словарях, правда, всегда с опозданием: одни слова вдруг появляются ниоткуда или становятся модными в силу ситуации, а другие постепенно выходят из употребления, устаревают и исчезают. У переводчика в этом отношении есть преимущество: он смотрит на чужой язык со стороны и более чувствителен к изменениям. Переводчик-японист Екатерина Тарасова рассказала Грамоте о новых явлениях в японском языке.
...Носители языка не всегда могут уследить за тем, что...
...В Японии очень внимательно относятся к неологизмам....
Естественные языки складывались сами собой. В них много нелогичного, случайного, избыточного, двусмысленного, сложного. А что если попробовать создать «разумный язык», специально «скроить» его так, чтобы он точно описывал мир и облегчал взаимопонимание? История знает несколько таких попыток: грандиозных, но неудачных.
...Естественные языки складывались сами собой. В них много...
...Лингвистические утопии просветителей Джон Уилкинс...
Международное исследование выявило прямую зависимость между прозрачностью календарных наименований в языке и тем, насколько хорошо носители языка справляются с вычислением дат и сроков. Авторы новой работы сравнили непрозрачные и прозрачные системы. В непрозрачных названия дней и месяцев не имеют явной связи с их порядком (например, в английском — Tuesday, August). В прозрачных системах (например, в китайском) дни и месяцы часто обозначаются цифрами: вторник как день-2, а август как ...
...Международное исследование выявило прямую зависимость...
За четыре года общая сумма штрафов за нарушение закона составила более 4,5 млн рублей. Редакции и учредители СМИ получили 18 письменных предупреждений за распространение материалов, содержащих нецензурную брань. Кроме того, сайты СМИ получили более восьми тысяч обращений от Роскомнадзора в связи с бранью в комментариях к материалам, на которые также распространяется закон. Запрет на сквернословие в средствах массовой информации был установлен в
...За четыре года общая сумма штрафов за нарушение закона...
Число текстов, сгенерированных искусственным интеллектом, в последние годы растет в геометрической прогрессии. И качество таких текстов постоянно улучшается. А это значит, что определить, к примеру, реальное авторство учебной работы будет все труднее. Ведь текст, порожденный нейросетями, выглядит уникальным, его не распознаёт проверка инструментами вроде «Антиплагиата». Однако справиться с этой задачей обещают исследователи Высшей школы экономики.
...Число текстов, сгенерированных искусственным интеллектом...