Распознавание рукописных текстов — задача, где пересекаются лингвистика, история и машинное обучение. Как научить программу понимать сотни тысячи документов, созданных больше ста лет назад — да к тому же не всегда грамотными и аккуратными людьми? С этой задачей призвана справиться новая разработка специалистов Новосибирского государственного университета. Магистрант факультета информационных технологий НГУ Степан Гудков под руководством ...
...Распознавание рукописных текстов — задача...
Не только в сельских школах, но и в городах-миллионниках не хватает учителей русского языка и литературы. На региональных филфаках сокращается число бюджетных мест и количество учебных часов на профильные предметы. «Российская газета» обсудила эту проблему с экспертами.
...Не только в сельских школах, но и в городах-миллионниках...
...В разговоре участвовали доктора филологических наук...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Ответственный редактор монографии — академик Николай Николаевич Казанский, специалист по классической филологии и индоевропеистике. Книга рассчитана на широкий круг читателей, которые интересуются российской наукой и ее историей.
...Ответственный редактор монографии — академик...
...Институт лингвистических исследований имеет богатую...
Даже специалисты не всегда могут дать однозначный ответ на вопрос, как пишется то или иное слово. Лингвист Алексей Лебедев в статье для журнала «Наука и жизнь» показал на примерах, как заимствованные слова принимают вид, соответствующий нормам русского языка, и порекомендовал интернет-ресурсы для проверки сложных случаев.
...Даже специалисты не всегда могут дать однозначный ответ...
...Проблема графической адаптации иноязычных заимствований...
Включение интернет-сленга в авторитетные лексикографические издания отражает процесс естественной эволюции языка под влиянием цифровых платформ. Недавний пример — обновление словника Кембриджского словаря, в который вошли понятия из интернет-культуры последних лет. Skibidi — слово, которое может иметь различные значения, такие как «крутой» или «плохой», либо использоваться в качестве шутки. Термин приобрел популярность благодаря вирусному анимационному ...
...Включение интернет-сленга в авторитетные лексикографические...
16–17 октября в Таврическом дворце Санкт-Петербурга состоялась конференция «Русский язык — основа интеграционного диалога в регионе СНГ». Мероприятие, организованное Межпарламентской Ассамблеей СНГ (МПА СНГ) и Советом Федерации, собрало более 700 участников из 18 стран, включая все государства Содружества. На конференции было представлено около 200 докладов, охватывающих роль русского языка в образовании, праве, искусстве, цифровых технологиях и
...16–17 октября в Таврическом дворце Санкт-Петербурга...
Коллектив молодежной лаборатории лингвистической антропологии Камчатского государственного университета им. Витуса Беринга существенно продвинулся в документировании языкового наследия региона. За 2024–2025 годы диалектологи описали 2916 слов камчатского наречия, оцифровали 7,5 часа архивных аудиозаписей. Это часть масштабной работы по созданию электронного ресурса «Краткий словарь русских говоров Камчатки». Территориальная разновидность русского языка на ...
...Коллектив молодежной лаборатории лингвистической антропологии...
К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Язык всё время меняется, и за 25 лет в нем изменилось многое: звучание слов, произношение звуков, интонация. Появились новые словообразовательные модели, некоторые новые синтаксические конструкции стали уже совершенно привычными. К примеру, раньше конструкция можно, пожалуйста... была абсолютно недопустима, а теперь молодежь даже не понимает, в чем здесь проблема.
...Язык всё время меняется, и за 25 лет в нем изменилось...
...Грамота уже 25 лет наблюдает за жизнью русского языка...