Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
3 февраля отмечают Всемирный день борьбы с ненормативной лексикой, заявленная цель которого — призвать людей отказаться от использования мата и привлечь внимание к вопросам культуры речи. И хотя история появления этого дня туманна, у нас есть хороший повод обсудить, что такое обсценная лексика, почему она табуирована и как к ней относятся в разных странах.
...3 февраля отмечают Всемирный день борьбы с ненормативной...
...Мать, театр и строгая критика Строго говоря,...
Исследование, проведенное на платформе онлайн-рекрутинга hh.ru, показало, что среди слов и фраз, которые вызывают наибольшее раздражение, лидируют уменьшительно-ласкательные формы, такие как человечек и задачка. На втором месте по частоте упоминания — слово засинкаться, а также родственные ему синк и синкануться (от англ. synchronization ‘синхронизация’ в значении ‘встреча, позволяющая синхронизировать работу команды’). Эти слова упомянули 21% ...
...Исследование, проведенное на платформе онлайн-рекрутинга...
Про русский язык сегодня известно очень много. Чтобы сделать в русистике что-то действительно новое, хорошо бы посмотреть на описание языка радикально иначе. Такой взгляд со стороны типологии, как мне кажется, может быть продуктивным.
...Про русский язык сегодня известно очень много. Чтобы...
...Я хоть и работаю в Институте русского языка давно и...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
В ЕГЭ по русскому языку станет допустимым прибегать к интерпретации сюжета мультфильма, аниме, манги, комикса, графического романа или компьютерной игры. Об этом говорится в опубликованном на сайте Федерального института педагогических измерений (ФИПИ) «Навигаторе самостоятельной подготовки к экзамену». Использовать подобные аргументы можно будет в задании 27, в котором требуется написать сочинение по прочитанному тексту. В
...В ЕГЭ по русскому языку станет допустимым прибегать...
Какие этапы проходит иноязычное слово, прежде чем стать своим, окончательно закрепиться в русском языке? Об этом – в интереснейшей статье Леонида Петровича Крысина «Этапы освоения иноязычного слова», опубликованной в журнале «Русский язык в школе» (№ 2, 1991).
...Какие этапы проходит иноязычное слово, прежде...
...В школьной программе и учебниках русского языка не...
Проблема различения языка и диалекта не перестает быть актуальной для взаимоотношений разных народов и стран. От лингвистов требуют предъявить строгие научные критерии разграничения этих понятий, но в действительности едва ли не большую роль играют экстралингвистические факторы.
...Проблема различения языка и диалекта не перестает быть...
...Задача с двумя неизвестными Представим, что есть два...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
О нововведении сообщил директор Координационного центра доменов .RU/.РФ Андрей Воробьев, выступая на круглом столе «Кириллица в интернете. Домен .РФ — символ значимости русского языка в современном мире». Воробьев уточнил, что принятие окончательного решения учредителями домена ожидается в июне текущего года. «Сейчас идет тестирование с регистраторами, скоро можно будет зарегистрировать имена с 25 новыми символами, — объяснил гендиректор ООО «
...О нововведении сообщил директор Координационного центра...