В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Все мы, носители русского языка, тем или иным образом ощущаем изменения в языке. Но далеко не все могут уловить сущность этих изменений — для этого нужен профессиональный навык, профессиональный взгляд. И тогда начинают описывать порчу языка.
...Все мы, носители русского языка, тем или иным образом...
...Грамота уже 25 лет наблюдает за жизнью русского языка...
Научный руководитель Грамоты Владимир Пахомов пишет в Газете.ru о том, почему не надо бояться молодежного сленга.
...Научный руководитель Грамоты Владимир Пахомов пишет...
...Почему нас так раздражает речь подростков? Непонятные...
Язык меняется вместе с культурой и обществом. Вместо того чтобы упрекать молодежь в «порче» языка, нужно вдохновлять ее собственным примером — такое мнение высказала филолог Дарья Зарубина в статье журнала «Наука и жизнь».
...Язык меняется вместе с культурой и обществом. Вместо...
...Люди негативно реагируют на изменения в языке, потому...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Выбор слов года в 2024 году демонстрирует, что язык чутко реагирует на изменения в обществе, отражая как глобальные тенденции, так и локальные особенности. Эти слова служат своего рода снимком времени, позволяя понять, что волновало людей в течение года. В этом материале мы решили разделить их на несколько категорий.
...Выбор слов года в 2024 году демонстрирует...
...Влияние цифровой среды и ее проблемы Brain...
Сервис управления соцсетями LiveDune совместно с СПбГУ провел масштабное исследование современного российского интернет-сленга. Набор данных включал 56 млн комментариев, оставленных в самых популярных в России социальных сетях. Выявлением сленга занималась нейросеть «Ольга Станиславовна», созданная командой LiveDune специально для оценки тональности соцсетевого контента. Авторы проанализировали частотность использования сленговых слов и составили рейтинг самых распространенных.
...Сервис управления соцсетями LiveDune совместно с СПбГУ...
Почему мы иногда говорим где территориально, а не просто где? О каких тенденциях говорят слова из молодежного сленга масик, чечик и нормис? Какие функции в речи выполняют слова вроде штуковина с размытой семантикой? Эти и множество других тем рассматриваются в новом номере «Трудов Института русского языка им. В. В. Виноградова», посвященном 90-летию Леонида Петровича Крысина.
...Почему мы иногда говорим где территориально, а...
...Где территориально и когда по времени Обе...
Книга «Табу слов у народов Восточной Европы и Северной Азии» в двух частях — фундаментальный труд по этнографии и лингвистике, который не переиздавался с 1929 года. Этнограф и фольклорист Дмитрий Зеленин подробно описал языковые табу у разных народов Евразии в сопоставлении с другими регионами мира.
...Книга «Табу слов у народов Восточной Европы...
...Древние считали, что «подлинные» названия...
Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...