Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Ведущая рубрики «Русский устный», член редакционного совета портала «Грамота.ру» Юлия Сафонова исследует некоторые рекламные выражения, свидетельствующие о возникновении нового значения слов «реально» и «конкретно».
...Ведущая рубрики «Русский устный», член редакционного...
Владимир Владимирович был активным участником всех самых главных лингвистических проектов последней трети XX и начала XXI века. Все годы работы нашего портала он был его научным консультантом. Он один из авторов академической «Русской грамматики» 1980 года, обобщившей все достижения отечественного языковедения (авторы «Русской грамматики» были удостоены Государственной премии СССР 1982 года), лингвистического энциклопедического словаря ...
... Владимир Владимирович был активным участником...
Транслитерация — побуквенная передача слова, написанного одним алфавитом, средствами другого алфавита. В отличие от транскрипции, отражающей звучание слова, транслитерация имеет дело только с письменным языком, с буквами. В каких сферах применяется транслитерация и какие трудности с ней связаны?
...Транслитерация — побуквенная передача слова...
...«Приручить» чужие графемы В 2024&...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Проект «Слово Толстого» — цифровой...
В исследовании участвовала группа из 34 студентов бакалавриата МГППУ — будущие учителя начальных классов. В течение двух лет с ними работали специалисты по педагогической психологии, изучая их восприятие художественных произведений. Результаты показали, что бакалавры недостаточно готовы к самостоятельной работе с художественными текстами. Так, четверть студентов не поняла основную идею рассказа, который им предложили для анализа. Около половины не смогли верно определить чувства и ...
...В исследовании участвовала группа из 34 студентов бакалавриата...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов обсуждают, как правильно ставить ударение в названии подмосковного города «Балашиха» и как по произношению этого слова можно отличить приезжих от местных жителей.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Диалектный корпус позволяет ставить и решать новые...
После того как в среду, 22 ноября, портал Грамоты был перезапущен в новом дизайне и с новой поисковой системой, команда внимательно следила за реакцией пользователей. Анализ обратной связи позволяет нам совершенствовать работу портала. Вот некоторые изменения, которые были внесены: большинство ссылок и редиректов стали работать корректно; снижен порог, отсекающий в выдаче нерелевантные ответы справочной службы, — теперь пользователи видят гораздо больше ответов;
...После того как в среду, 22 ноября, портал Грамоты был...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...