Распознавание рукописных текстов — задача, где пересекаются лингвистика, история и машинное обучение. Как научить программу понимать сотни тысячи документов, созданных больше ста лет назад — да к тому же не всегда грамотными и аккуратными людьми? С этой задачей призвана справиться новая разработка специалистов Новосибирского государственного университета. Магистрант факультета информационных технологий НГУ Степан Гудков под руководством ...
...Распознавание рукописных текстов — задача...
В последние годы в России идет интенсивный поиск национальной идеи. Количество предлагаемых вариантов огромно — от «вливания» в Европу и евразийства до пития водки или пива. При всем обилии идей ни одна не становится пока доминирующей. В чем здесь дело?
...В последние годы в России идет интенсивный поиск национальной...
...Прежде всего не в самих идеях (большинство из которых...
Загадочное явление современного русского языка — всё чаще мелькает и распространяется в речи диминутив сердечко, причем в таком контексте, где он кажется удивительно архаичным: в контексте эмоциональных переживаний, в том числе в первом лице и в речи мужчин. Лингвист Ирина Фуфаева попыталась разгадать эту загадку.
...Загадочное явление современного русского языка &mdash...
...Это же слово из XIX века, не так ли? Даже из эпохи...
«О составлении „Этимологического словаря русского языка“ как о главной цели своей научной деятельности я мечтал еще во время первых исследований, посвященных влиянию греческого языка на славянские (1906-1909), — писал Макс Фасмер о своем труде. — Многие пожелания, высказанные в рецензиях на мой словарь, несомненно, будут полезными для последующего русского этимологического словаря, в котором должно быть уделено особое внимание многочисленным словам, названным здесь неясными. Если бы мне пришлось начать работу снова, я уделил бы большее внимания калькам и семасиологической стороне».
...«О составлении „Этимологического словаря...
...Известный ученый-славист В. Кипарский, пытаясь...
Полчаса на редактуру мало, редактирование — медленный процесс. Но скорость жизни в последнее десятилетие повысилась, а количество текстов увеличилось. Типичный редакторский кошмар: «У меня всего полчаса на этот текст». Наш чек-лист поможет сосредоточиться, когда приближается дедлайн, а вы не знаете, за что хвататься.
...Полчаса на редактуру мало, редактирование &mdash...
...Максимум возможного за минимум времени Развитие цифровых...
Недавно принятая в России Концепция государственной языковой политики призывает к защите русского языка от иностранных заимствований. До этого, в феврале 2023 года, были приняты поправки в закон «О государственном языке РФ», которые ограничивают использование англицизмов в рекламе. Россия — не единственная страна, чье правительство обеспокоено защитой своего языка от иностранного влияния. Такую же политику проводит и канадская ...
...Недавно принятая в России Концепция государственной...
Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке.
...Сотрудники Лаборатории цифровой лингвистики МИФИ Александра...
...До нас дошел очень большой массив рукописей на церковнославянском...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Когда мы много знаем о какой-то теме, бывает трудно написать о ней так, чтобы наша мысль была понятна неспециалисту. Когнитивный психолог и психолингвист Стивен Пинкер предлагает несколько стратегий улучшения качества письма, которые помогут писать ясные и эффективные тексты с учетом разницы в картине мира между экспертом и его аудиторией.
...Когда мы много знаем о какой-то теме, бывает трудно...
...Стивен Пинкер известен своими увлекательными рассуждениями...
В Российской академии наук подготовлена новая, переработанная и значительно дополненная, редакция «Правил русской орфографии и пунктуации». Работа над ней велась давно, с начала 1990-х годов. Текст правил готовился коллективом специалистов сектора орфографии и орфоэпии Института русского языка им. В. В. Виноградова, а затем — на всех этапах работы — подробно рассматривался, обсуждался на заседаниях Орфографической комиссии при Отделении литературы и языка РАН.
...В Российской академии наук подготовлена новая, переработанная...
...В составе комиссии — не только работники Академии...