Нейросети произвели настоящую революцию, показав, что искусственный интеллект способен создавать тексты не хуже людей (некоторые писатели даже выпустили книги в соавторстве с ИИ). Одна из самых популярных нейросетей — ChatGPT от компании Open AI. Что происходит у нее «под капотом»?
...Нейросети произвели настоящую революцию, показав, что...
...понимает основную нить диалога благодаря накопленной статистике...
В 2024 году Грамота выбирала слово года в несколько этапов, опираясь на три источника данных: предложения наших пользователей, статистику (запросы на портале, данные поисковых систем и нашего партнера СКАН-Интерфакс) и голосование лингвистов. В первый список кандидатов вошли многие популярные слова, в итоге не попавшие в шорт-лист. Мы решили посмотреть, как сложилась судьба самых заметных слов прошлого года: подтверждают ли новые данные наш выбор?
...В 2024 году Грамота выбирала слово года в несколько...
... Интернете: «Вордстату» Яндекса, статистике...
...point of view, точка зрения) сильнее вырос в статистике...
...mdash; это слово сохранило свои позиции только в статистике...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...нужно распознать текст, процент ошибок (согласно статистике...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...текстов, и поскольку цифровые методы основаны на статистике...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Со второй половины 2010-х годов компьютерные языковые...
...От правил — к статистике В самом начале своего...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...: они, как и любая технология, основанная на статистике...
Выбором «слова года» занимаются авторитетные словари, языковые институты, газеты и сайты. С недавнего времени такую акцию проводит и Грамота. Чем отличается наш подход к определению «слова года»? Как мы собираем данные, фильтруем и оцениваем их? Приоткрываем дверь на нашу социолингвистическую кухню. И предупреждаем: у большого «слова года» будет свита из «главных слов» в разных сферах.
...Выбором «слова года» занимаются авторитетные...
...действительно показывали хорошие результаты и по статистике...
Когда-то мы смеялись над корявостью и глупостью первых языковых моделей. Сегодня чат-боты пишут за людей деловые письма и посты, сочиняют рассказы, ведут задушевные беседы и приводят аргументы в спорах. Есть ли что-то, чем речь машины в корне отличается от человеческой? И может ли эксперт — или даже другая машина — обнаружить эту разницу?
...Когда-то мы смеялись над корявостью и глупостью первых...
...nbsp;уровне, невидимом человеческому глазу: в статистике...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...
Проект запустился около года назад, когда научно-образовательный союз «Родное слово» вместе с командой Tolstoy Digital выиграл грант Президентского фонда культурных инициатив. С тех пор в интернете создается новое пространство — цифровой путеводитель по наследию Льва Толстого. Он заинтересует людей гуманитарных профессий и всех, кто любит русскую литературу и ищет новые способы узнавать ее глубже. Благодаря современным технологиям путеводитель будет включать систему навигации и ...
...Проект запустился около года назад, когда научно-образовательный...