В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Закон о защите русского языка был внесен в Госдуму еще в октябре 2023 года и вызвал бурное обсуждение. В первом варианте предлагалось ввести запрет на использование заимствованных слов вроде coffee или sale в названиях объектов, на вывесках, этикетках и даже в СМИ. Однако против таких ограничений возражали в предпринимательской среде: требование не использовать латиницу и переводить зарегистрированные иностранные названия могло вступать в противоречие с уже существующими правами на такие ...
...Закон о защите русского языка был внесен в Госдуму...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Известно, что младенцы уже в возрасте 8–14 месяцев начинают осознавать связь между словами и предметами. Причем они делают это автоматически, без целенаправленного обучения. Оказывается, на это способны и домашние кошки — и они учатся этому даже быстрее детей. Научная группа из Университета Адзабу (Япония) провела с кошками эксперимент, известный как задача с переключением. Его суть в том, что испытуемым сначала показывают пары «
...Известно, что младенцы уже в возрасте 8–...
Подростки активно используют продукты с генеративным искусственным интеллектом (генИИ) для решения учебных задач, борьбы со скукой и перевода текстов с других языков. При этом родители и учителя отстают от них в понимании этих технологий. Об этом говорят данные опроса Common Sense Media — независимой НКО, которая предоставляет обзоры и рейтинги медиа и технологий с целью информирования общества об их влиянии на детей и подростков1.
...Подростки активно используют продукты с генеративным...
Производитель товаров для геймеров Razer анонсировал головную гарнитуру Razer Skibidi. В нее встроен переводчик с «brainrot-языка», на котором общается молодое поколение игроков (особенно представители поколения «альфа», родившиеся в начале 2010-х). Само слово скибиди в названии — типичный пример подросткового сленга, слово с размытым значением, обычно означающее что-то плохое, глупое и малопристойное. Помимо skibidi, переводчик распознает также слова ...
...Производитель товаров для геймеров Razer анонсировал...
Бедность речи половина опрошенных русистов считает главной проблемой современного русского языка. На втором месте оказалось упрощение языка — его отметили 17% респондентов. Речь идет о написаниях вроде «щас» вместо «сейчас» и неверных ударениях (договорА вместо договОры). Распространение бранной лексики волнует 13% преподавателей. А вот активное заимствование иностранных слов беспокоит лишь 10% учителей. Примерно столько
...Бедность речи половина опрошенных русистов считает...
В июне наша справочная служба побила все рекорды и ответила на 865 вопросов пользователей! Из них мы выбрали четыре, чтобы рассказать об одном из проявлений игровой природы языка, напомнить правила написания названий некоторых редакторских профессий и разобраться с дробными числительными и существительными, которыми они управляют.
...В июне наша справочная служба побила все рекорды и&...
...Управление Вопросы: 1. Как правильно следует...
В середине сентября Робин Спир, создательница проекта Wordfreq, который анализировал использование языка в интернете, объявила о том, что размещенная на нем информация больше не будет обновляться. В своем посте на платформе для разработчиков GitHub она объяснила свое решение тем, что среди данных для анализа оказалось слишком много «мусорных», и обвинила крупные компании, разрабатывающие генеративные нейросетевые модели, в создании «беспорядка»
...В середине сентября Робин Спир, создательница проекта...
Современные инструменты распознавания языков, такие как LangID (Language Identification) компании Google, используются для автоматического перевода, общения с пользователем на его языке, классификации и фильтрации данных. Однако со многими редкими языками они работать не умеют. Например, тексты на навахо — наиболее распространенном из языков коренных американцев — система распознает неправильно, как тексты на исландском, лингала, волоф и других языках. Этот пример отражает более ...
...Современные инструменты распознавания языков, такие...