Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Есть ситуации, в которых отношения между словами можно выразить разными способами. Например, можно сказать «учебник истории», а можно «учебник по истории». В последнее время способ, при котором используется предлог, становится основным — это явление иногда называют экспансией предлогов. При этом значение многих предлогов размывается, а сами они все чаще выражают не лексические отношения, а более абстрактные грамматические. Мы решили повнимательнее присмотреться к конструкциям с «по» и «для», а потом обсудить наши наблюдения со специалистом.
...Есть ситуации, в которых отношения между словами...
...Расширение зоны ответственности предлогов В публицистических...
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
...Появление интернета изменило в том числе и привычные...
...Что такое Национальный словарный фонд: концепция и...
Восьмого апреля в 43 странах прошла акция «Тотальный диктант». Четыре фрагмента текста Василия Авченко написали онлайн и на очных площадках. «Участники из 43 стран написали двадцатый диктант в очном формате, 103 страны присоединились к акции в рамках онлайн-марафона и онлайн-диктанта. В России диктант фирменной юбилейной ручкой xGold на очных площадках написали более 125 000 человек. Больше всего участников в России традиционно собралось в Москве, куда пришли чуть ...
...Восьмого апреля в 43 странах прошла акция «Тотальный...
В древнегреческом языке были разные слова для обозначения разных видов любви. Некоторые славянские языки различают эротическую и неэротическую любовь. В русском же языке слово «любовь» многогранно и выражает целый спектр чувств.
...В древнегреческом языке были разные слова для обозначения...
...Греческая типология В древнегреческом языке есть разные...
В русском языке глагол-сказуемое согласуется с подлежащим по лицу и числу в настоящем времени и по роду и числу в прошедшем. Когда подлежащее выражено одним словом — существительным или местоимением, с согласованием не возникает проблем. Но если подлежащее нетипичное, возможны разные варианты. Применить корпусные методы к таким конструкциям сложно, потому что в корпусе они почти не встречаются. Но можно изучать их методами экспериментального синтаксиса.
...В русском языке глагол-сказуемое согласуется с подлежащим...
...Три стратегии выбора Мы будем рассматривать случаи...
В этом году чемпионат проходит в России в четвертый раз. Это не совсем обычное соревнование: подростки могут здесь написать эссе по математике, трактат по физкультуре или концепцию музыкального фестиваля. О том, зачем понадобилась альтернатива школьному «итоговому сочинению», рассказал председатель экспертного жюри, доцент факультета гуманитарных наук НИУ ВШЭ и руководитель Лаборатории развития интеллектуальных состязаний Михаил Павловец.
...В этом году чемпионат проходит в России в четвертый...
...Грамота: В чем особенность вашего чемпионата, чем он...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Многие пишущие по-русски уверены, что «разыскной» через А — безграмотность, правильно только «розыскной». На самом деле это слово является исключением из общего правила, согласно которому в русском правописании действует морфологический принцип. Нас сбивает наличие, с одной стороны, существительного «розыск», а с другой — глагола «разыскивать». Приставка, которую мы видим в этих словах, подчиняется особому правилу, которое связано с ударением.
...Многие пишущие по-русски уверены, что «разыскной...
...«Не может человек, получивший высшее юридическое...
Технологии на базе искусственного интеллекта проникли в повседневную жизнь: мы узнаем у них о погоде, поручаем им рутинные задачи и даже обсуждаем с ними личные проблемы. У современного человека появился новый тип собеседника, который может быть и помощником, и источником эмоциональной поддержки. Насколько естественно для человека вступать в диалог с неживыми объектами?
...Технологии на базе искусственного интеллекта проникли...
...Ожившие силы природы С древних времен люди наделяли...