Каждый десятый участник «Тотального диктанта» справился с ним на высшем уровне. Об этом сообщил председатель Филологического совета Тотального диктанта, научный сотрудник Института русского языка им. В. В. Виноградова РАН Владимир Пахомов. Количество отличников незначительно изменялось в зависимости от того, какую часть диктанта писали участники, — самой легкой оказалась четвертая часть. При этом в тексте, который предложила автор ...
...Каждый десятый участник «Тотального диктанта&...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Диалектный корпус позволяет ставить и решать новые...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...
Тема театра в поэзии конца ХХ века возникает в соответствии с провозглашением установки на игру как творческого метода. Так или иначе она звучит в текстах-манифестах поэтов-метареалистов Ивана Жданова («До слова»), Сергея Соловьева («Амфитеатр печатной машинки...») и Алексея Парщикова («Вступление»).
...Тема театра в поэзии конца ХХ века возникает...
...Все эти тексты обнаруживают как схождения между собой...
Носители языка понимают языковую норму по-разному и с недоверием относятся к ситуациям, в которых норма допускает варианты, объясняет научный консультант Грамоты Владимир Пахомов. Грамота законспектировала его выступление на научной конференции «Медиатекст: векторы развития и перспективы изучения», которая состоялась в рамках IV Костомаровского форума.
...Носители языка понимают языковую норму по-разному и...
...Ошибочные представления о русском языке, которые...
Любители словарных игр просят специалистов разобраться в вопросе о торговых названиях: являются ли они именами собственными (и, следовательно, в игру не принимаются) или нарицательными (и тогда имеют право на жизнь)? Им отвечает доктор филологических наук, специалист по терминологии Владимир Моисеевич Лейчик.
...Любители словарных игр просят специалистов разобраться...
...Уважаемые господа! Помогите вконец запутавшимся любителям...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...