Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
6 июня в России и за ее пределами отмечается День русского языка. Он приурочен ко дню рождения Александра Сергеевича Пушкина — именно его произведения, по общему признанию, заложили основу современного русского литературного языка. В этот день мы поздравляем пользователей, экспертов, друзей и партнеров Грамоты с нашим общим праздником! Русскому языку можно пожелать только активного и творческого долголетия. А всем, кто говорит по-русски ...
...6 июня в России и за ее пределами отмечается...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов обсуждают, как правильно ставить ударение в формах слова «герб», а также рассуждают об интересном этимологическом случае — при поразительном внешнем сходстве слова «герб» и «гербарий» не являются родственными.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Пока политики ищут национальную идею, которая смогла бы консолидировать общество, такая идея, как представляется, уже овладела умами россиян: самоидентификация идет в поле русского языка. Трехлетний опыт общения с аудиторией программ «Как правильно?» и «Говорим по-русски!» (а вопросы от слушателей поступают к нам из более чем 70 городов России от носителей языка самых разных возрастов и социального положения, что позволяет считать нашу многомиллионную аудиторию неким представительным срезом общества) показывает: реформа орфографии заставляет испытывать тревогу и вызывает не меньший, если не больший интерес, чем проводимые экономические и социальные реформы.
...Пока политики ищут национальную идею, которая смогла...
...Своеобразным пропуском в элиту общества кажется не...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Проект «Слово Толстого» — цифровой...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Диалектный корпус позволяет ставить и решать новые...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
Владимир Владимирович был активным участником всех самых главных лингвистических проектов последней трети XX и начала XXI века. Все годы работы нашего портала он был его научным консультантом. Он один из авторов академической «Русской грамматики» 1980 года, обобщившей все достижения отечественного языковедения (авторы «Русской грамматики» были удостоены Государственной премии СССР 1982 года), лингвистического энциклопедического словаря ...
... Владимир Владимирович был активным участником...
В привычном слове «чертополох» мало кто сегодня чувствует присутствие черта. Однако этимология этого названия прямо указывает на нечистую силу. О магической функции чертополоха — статья в журнале «Наука и жизнь».
...В привычном слове «чертополох» мало кто...
...Название «чертополох» связано с народным...