В ХМАО — Югре ведется работа по созданию цифровых корпусов хантыйского и мансийского языков. Об этом сообщает правительство региона по итогам рабочего совещания. Цифровые корпуса представляют собой масштабные текстовые базы данных, предназначенные для изучения и анализа структуры, лексики и грамматики языков коренных народов округа. В рамках государственной программы осуществляется параллельный перевод предложений с русского на мансийский язык, создание аудиозаписей речи, оцифровка ...
...В ХМАО — Югре ведется работа по созданию...
Премьер-министр России Михаил Мишустин подписал распоряжение об утверждении списка словарей, справочников и грамматик, фиксирующих нормы современного русского литературного языка при его использовании в качестве государственного. В список вошли разработанные Институтом русского языка им. В. В. Виноградова РАН Орфографический словарь русского языка как государственного языка Российской Федерации и Орфоэпический словарь русского языка как государственного языка Российской ...
...Премьер-министр России Михаил Мишустин подписал распоряжение...
«Чем проще, тем лучше» — это правило действует во многих областях, в том числе в работе с текстами. Например, тяжелый слог юридических документов раздражает и профессиональных юристов, и их клиентов. Но, как выясняется, есть исключения. Когда речь идет о заголовках новостных статей, профессионалы и читатели не так единодушны в своих предпочтениях. Исследователи из США провели несколько экспериментов, чтобы выяснить это. Для ...
...«Чем проще, тем лучше» — это...
В экспертном голосовании за одиннадцать слов-кандидатов участвовали более четырехсот филологов из разных городов России. В острой конкурентной борьбе «вайб» обошел «скуфа» и «прилет».
...В экспертном голосовании за одиннадцать слов-кандидатов...
...Тройка лидеров определилась в первые часы, но...
О начале работы над корпусом объявили участники круглого стола, прошедшего в Тувинском институте гуманитарных и прикладных социально-экономических исследований (ТИГПИ) 22 июня. Круглый стол был посвящен 95-летию тувинской письменности и проводился в рамках Международного десятилетия языков коренных народов под эгидой ЮНЕСКО. Новый корпус будет насчитывать более 20 млн словоупотреблений, в том числе из газетного корпуса (около 10 млн), параллельного ...
...О начале работы над корпусом объявили участники...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
За четыре года общая сумма штрафов за нарушение закона составила более 4,5 млн рублей. Редакции и учредители СМИ получили 18 письменных предупреждений за распространение материалов, содержащих нецензурную брань. Кроме того, сайты СМИ получили более восьми тысяч обращений от Роскомнадзора в связи с бранью в комментариях к материалам, на которые также распространяется закон. Запрет на сквернословие в средствах массовой информации был установлен в
...За четыре года общая сумма штрафов за нарушение закона...
Каждый, кто пишет в газете или популярном журнале о науке, знает, какие мучения вызывает «ввод» научного термина. Часто это слово не знакомо широкому читателю, непонятно даже из контекста и, как правило, воспринимается как «некрасивое» для русского уха и глаза. Сейчас привычные языковые стили меняются, приобретая новые черты. Что представляет собой новый язык науки? Каким становится главное научное слово — термин?
...Каждый, кто пишет в газете или популярном журнале о...
...Сложившийся к началу XX века научный язык — тот...
Как убедиться, что текст достаточно прост и понятен — например, для детей определенного возраста, иностранцев или людей с ментальными особенностями? Сегодня определить уровень доступности текста помогают не только разнообразные формулы читабельности, но и искусственный интеллект. О возможных подходах к оценке текстов разных типов Грамота расспросила кандидата педагогических наук Антонину Лапошину, специалиста по компьютерной лингвистике в лаборатории когнитивных и лингвистических исследований Института Пушкина.
...Как убедиться, что текст достаточно прост и понятен...
...Грамота: На что опираются системы оценки сложности/...
Когда мы говорим «словарь», какие издания приходят в голову прежде всего? Наверняка кто-то вспомнит словари Даля, Ожегова и Ушакова, филологи назовут словарь Фасмера, люди старшего поколения — энциклопедию Брокгауза и Ефрона. Словарные статьи в нашем представлении обычно начинаются со слова или словосочетания и следуют друг за другом в алфавитном порядке. Но есть словари, которые устроены совсем иначе: в них единицы отобраны и организованы в единое целое по другим принципам.
...Когда мы говорим «словарь», какие издания...
...Что нового могут придумать лексикографы Лексикография...