Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Формы организации текстового материала в Интернете весьма разнообразны. Не претендуя на формирование понятий, связанных с Интернетом, попробуем разобраться в семантике тех слов, которые, используя Интернет, мы уже часто употребляем, хотя они еще не получили своего места в лексической системе русского языка.
...Формы организации текстового материала в Интернете...
...Условно виртуальные тексты по способу образования и...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Диалектный корпус позволяет ставить и решать новые...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
Сборник работ Виктора Петровича Григорьева «Будетлянин» посвящен творчеству русского поэта Велимира (Виктора Владимировича) Хлебникова. Грамота публикует одну из статей, вошедших в этот сборник.
...Сборник работ Виктора Петровича Григорьева «...
...Веха — один из псевдонимов Хлебникова....
Нередко в практике телевидения и радиовещания возникает ситуация, которую наблюдал каждый из нас. Выступает крупный в своей области знания ученый, касается весьма важной темы — мало нам знакомых, но существенных научных проблем, только еще складывающейся теории и вытекающих из нее поразительных по значимости возможностей. Выступление необыкновенно интересно. Но стоит нам уловить в его речи произношение «беспрецеНдентный», где первый звук «н» явно лишний; или «изобрЕтенный недавно прибор» (вместо «изобретённый»); или «это играет большое значение» (вместо «имеет большое значение»), как мы отчетливо чувствуем, что наше увлечение передачей рассеивается, угасает, что мы уже отвлеклись от главной мысли, а то и просто потеряли ее. Причина заключается в том, что выступающий не в полной мере владеет литературным языком. Тогда как в публичной речи это абсолютно необходимо.
...Нередко в практике телевидения и радиовещания возникает...
...Основная черта литературного языка — общепринятость...
Изучение систем коммуникации животных по понятным причинам долгое время ограничивалось наблюдениями. Затем появилась аппаратура, записывающая аудио- и видеоинформацию, возникла идея экспериментального подхода, и, наконец, на помощь специалистам пришли цифровые технологии и искусственный интеллект. Грамота рассказывает, как специалисты сегодня применяют эти методы и что узнаю́т с их помощью.
...Изучение систем коммуникации животных по понятным причинам...
...Наблюдение, слежка и прослушка Чтобы что-то понять...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...
Сервисы обновленной Грамоты становятся более технологичными. Например, в них будут применяться нейронные сети. Руководитель ИИ-направления, компьютерный лингвист Михаил Копотев рассказал про основные направления работы и возможности новых технологий.
...Сервисы обновленной Грамоты становятся более технологичными...
...Грамота: Что изменится для пользователей в результате...
В журнале «Неофилология» вышла статья филологов Ольги Ребковец и Натальи Милянчук о том, как изменилась система жанров научно-популярного изложения в связи с развитием технологий. Авторы рассматривают, какую цель преследует тот или иной текст и какие коммуникативные позиции занимают автор и адресат.
...В журнале «Неофилология» вышла статья...
...С начала XXI века объем текстов в научно-популярном...