К малоресурсным относятся те языки, которые имеют ограниченное количество данных, доступных для анализа и обработки. Это затрудняет обучение нейросетевых моделей работе с этими текстами. Для русского или английского языков давно существуют инструменты, которые автоматически оценивают сложность текстов. Но для малых языков их практически не было. Психолингвисты НИУ ВШЭ разработали онлайн-инструмент, предназначенный для определения сложности малоресурсных ...
...К малоресурсным относятся те языки, которые...
Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Недавнее исследование, проведенное учеными из ...
Книга «Табу слов у народов Восточной Европы и Северной Азии» в двух частях — фундаментальный труд по этнографии и лингвистике, который не переиздавался с 1929 года. Этнограф и фольклорист Дмитрий Зеленин подробно описал языковые табу у разных народов Евразии в сопоставлении с другими регионами мира.
...Книга «Табу слов у народов Восточной Европы...
...Древние считали, что «подлинные» названия...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов рассуждают об одной из загадок русского языка — образовании названий жителей разных городов, начиная с древнего наименования жителей Курска.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
В экспертном голосовании за одиннадцать слов-кандидатов участвовали более четырехсот филологов из разных городов России. В острой конкурентной борьбе «вайб» обошел «скуфа» и «прилет».
...В экспертном голосовании за одиннадцать слов-кандидатов...
...Тройка лидеров определилась в первые часы, но...
«Сбер» и SberDevices совместно с некоммерческой организацией «Центр образования и исследования жестового языка» запустили социально-образовательный проект — видеословарь для изучения русского жестового языка (РЖЯ). В словарь вошли около 400 жестов, примерно соответствующих 660 словам русского языка. Сейчас сайт позволяет выбрать слово поиском или из списка, а затем просмотреть соответствующее видео — в
...«Сбер» и SberDevices совместно с ...
Что нужно знать родителям школьника, у которого проснулся интерес к устройству языка? Какие есть возможности проверить себя и узнать больше о лингвистической науке? Анастасия Пучкова и Алексей Старченко — тренеры и руководители команды, которая представляет Россию на Международной олимпиаде по лингвистике. Они рассказали Грамоте о том, как выбрать олимпиаду, увеличить шансы на победу и получить дополнительные баллы при поступлении.
...Что нужно знать родителям школьника, у которого...
...Мама, я хочу стать лингвистом! Интерес к лингвистике...
Ведущая рубрики «Русский устный», член редакционного совета портала «Грамота.ру» Юлия Сафонова рассказывает о семействе слов, происходящих от «броня», и рассказывает о разных лексических значениях этих слов в зависимости от ударения.
...Ведущая рубрики «Русский устный», член редакционного...
В Институте русского языка имени В. В. Виноградова РАН состоится масштабное теоретико-практическое мероприятие, посвященное цифровой лексикографии и ее применению в лингвистических исследованиях. Организаторы — Сектор типологии Института языкознания РАН совместно с Отделом корпусной лингвистики и лингвистической поэтики ИРЯ РАН. В состав программного комитета вошли Владимир Плунгян, Лариса Шестакова, Анна Кулева и Юрий Макаров.
...В Институте русского языка имени В. В. ...
В ноябре пользователи интересовались, среди прочего, тем, как произносится слово «кафе», как правильно писать названия разных видов сумок и как расставить знаки препинания в сложном предложении, которое стало предметом спора.
...В ноябре пользователи интересовались, среди прочего...
...Произношение Вопрос: Почему в слове кафе ф произносится...