Ответы справочной службы
Возможны оба варианта, выбор зависит от контекста.
Верно: корпусы текстов.
Словарями отмечается два произносительных варианта: текстово́й (с ударением во всех формах на окончании) и те́кстовый (с ударением во всех формах на основе). Оба они находятся в пределах нормы.
Справочники
Информация, размещенная на странице в Интернете, является электронным ресурсом удаленного доступа. Описание электронных ресурсов локального и удаленного доступа регулируется ГОСТ 7.82 — 2001 «Библиографическая запись. Библиографическое описание электронных ресурсов». Вот выдержки из документа. Схема описания электронного ресурса Основное заглавие является главным заглавием электронного ресурса и воспроизводится в том виде, в каком оно приведено в источнике ...
...Как оформить ссылку на интернет-источник?...
...Информация, размещенная на странице в Интернете, является...
Согласно "Толковому словарю русского языка" С. И. Ожегова и Н. Ю. Шведовой (М., 1997) визави – 1. нареч. Друг против друга. Сидеть визави. 2. нескл. м. и ж. Тот, кто находится напротив, стоит или сидит лицом к лицу к кому-н. Непрошеная визави. Всматриваться в своего визави. В словаре Н. Яновского "Новый словотолкователь, расположенный по алфавиту" (СПб., 1803) визави, нескл., ср., м., ж. имеет значение "двухместная ...
...Визави...
...Согласно "Толковому словарю русского языка"...
Журнал
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Нейросеть выучилась понимать язык без использования...
...Большие языковые модели — нейросети, способные...
Формы организации текстового материала в Интернете весьма разнообразны. Не претендуя на формирование понятий, связанных с Интернетом, попробуем разобраться в семантике тех слов, которые, используя Интернет, мы уже часто употребляем, хотя они еще не получили своего места в лексической системе русского языка.
...Формы организации текстового материала в Интернете...
...Заходите в наш портал!...
...Условно виртуальные тексты по способу образования и...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...Прогноз: текстовые данные для обучения нейросетей могут...
...В течение многих лет такие компании, как OpenAI...