В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Исследование, проведенное на платформе онлайн-рекрутинга hh.ru, показало, что среди слов и фраз, которые вызывают наибольшее раздражение, лидируют уменьшительно-ласкательные формы, такие как человечек и задачка. На втором месте по частоте упоминания — слово засинкаться, а также родственные ему синк и синкануться (от англ. synchronization ‘синхронизация’ в значении ‘встреча, позволяющая синхронизировать работу команды’). Эти слова упомянули 21% ...
...Исследование, проведенное на платформе онлайн-рекрутинга...
Системы распознавания речи работают с последовательностью звуков, которые могут быть преобразованы в текстовую запись. Однако в речи есть еще один важный слой — просодия. Она включает в себя интонацию, тон, словесное ударение и другие элементы. Просодия помогает нам различать вопросы и восклицания, распознавать шутки, понимать отношение собеседника к теме разговора. Новое исследование сотрудников Института Вейцмана в Реховоте (Израиль) показало, что эта система устроена ...
...Системы распознавания речи работают с последовательностью...
Сколько слов существует в русском языке? Ответ на этот вопрос и сложен, и прост. Трудно назвать точную цифру, и на это есть несколько причин: язык постоянно развивается, обновляется (одни слова появляются в речи, другие исчезают, уходят); масса диалектных слов пока учеными просто не зафиксирована и ни в каких словарях не описана; почти все профессии и научные дисциплины обладают «собственными» лексиконами, которые не входят в общенародную литературную речь; есть и другие причины.
...Сколько слов существует в русском языке? Ответ на этот...
...Мир слов воистину огромен, безбрежен. Лексическое ядро...
Вы не находите, что за последнее время русский язык сильно испортился? Давайте узнаем, как отвечают на этот вопрос специалисты. Многие книги из этой подборки переиздавались уже не раз, но неизменно исчезают из магазинов. Известные лингвисты напоминают нам о том, что язык меняется и он неотделим от жизни. Эти книги легко читать, они подарят вам не только знания, но и положительные эмоции.
...Вы не находите, что за последнее время русский язык...
... 1. Мария Елифёрова. Панталоны, фрак, жилет...
Тема театра в поэзии конца ХХ века возникает в соответствии с провозглашением установки на игру как творческого метода. Так или иначе она звучит в текстах-манифестах поэтов-метареалистов Ивана Жданова («До слова»), Сергея Соловьева («Амфитеатр печатной машинки...») и Алексея Парщикова («Вступление»).
...Тема театра в поэзии конца ХХ века возникает...
...Все эти тексты обнаруживают как схождения между собой...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Любимые всеми книги и фильмы часто рассказывают захватывающие и необычные истории. Но и таким форматам, как рекламный ролик или пост в блоге, чтобы попасть в топы просмотров, необходимо чем-то зацепить пользователя. Сегодня авторы нередко обращаются к генеративным языковым моделям в поисках вдохновения. Но есть ли в этом польза? Может быть, правы скептики, и их массовое применение убьет творчество? Исследователи Анил Доши из Лондонского ...
...Любимые всеми книги и фильмы часто рассказывают...
Статьи номера посвящены вводному слову «кстати», проблемам перевода с английского, формам личных имен в первом и третьем лице, концепту «документ» в речи крестьян и другим темам. Обратим внимание на три статьи.
...Статьи номера посвящены вводному слову «кстати...
...Способы сохранения гендерной неопределенности персонажей...
Уже сейчас писатели издают книги, которые написаны ими в соавторстве с нейросетями. Спецпроект «Писатели vs Нейросети», созданный изданиями «Системный Блокъ» и «Подтекст», анализирует, какие этапы создания художественного текста может упростить нейросеть и насколько полезны языковые модели.
...Уже сейчас писатели издают книги, которые написаны...
...Кто лучше напишет рассказ? В ходе эксперимента писателю...