Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
В июне наша справочная служба побила все рекорды и ответила на 865 вопросов пользователей! Из них мы выбрали четыре, чтобы рассказать об одном из проявлений игровой природы языка, напомнить правила написания названий некоторых редакторских профессий и разобраться с дробными числительными и существительными, которыми они управляют.
...В июне наша справочная служба побила все рекорды и&...
...Управление Вопросы: 1. Как правильно следует...
Цифровая коммуникация регулируется множеством неформальных правил, которые возникают на наших глазах. Мы обсуждаем время отправки сообщений, скорость реакции на них, уместность эмодзи, стикеров и скобочек, но самую важную роль играют слова. Рассказать о словесных кодах рабочих чатов Грамоте помогла Ольга Лукинова — эксперт по цифровым коммуникациям, автор телеграм-канала «Цифровой этикет».
...Цифровая коммуникация регулируется множеством неформальных...
...Чужой монастырь и корпоративная культура Цифровой...
Традиционная лекция о найденных в 2023 году грамотах была прочитана не только в Москве, но и в Новгороде, где она уже в пятый раз вызвала интерес у археологов, историков и других новгородцев. В интервью лингвист, доктор филологических наук, академик РАН Алексей Алексеевич Гиппиус рассказывает о результатах новгородских раскопок.
...Традиционная лекция о найденных в 2023 ...
...По словам Алексея Гиппиуса, берестяные грамоты ...
Профессиональный жаргон — это особая смесь из необычных слов, нестандартных ударений, странных сокращений и смешных идиом. Это словесные шифры, которые обычно понимают только свои. Угадать, кто такой «бобик» или «ходуля», невозможно. Как устроены птичьи языки разных профессий и чем они отличаются от стандартного литературного языка?
...Профессиональный жаргон — это особая смесь...
...Язык как средство социальной идентификации Язык, как...
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
...Появление интернета изменило в том числе и привычные...
...Что такое Национальный словарный фонд: концепция и...
Предлагаем вниманию читателей статью Сергея Петровича Обнорского, опубликованную в журнале «Русский язык в школе» (№ 5–6, 1939). Статья представляет собой текст доклада, прочитанного на заседании Правительственной комиссии по разработке единой орфографии и пунктуации 7 октября 1939 года. В этой работе рассматриваются спорные орфографические вопросы, стоявшие перед лингвистами в 1930-е годы, при подготовке общеобязательного свода правил русского правописания.
...Предлагаем вниманию читателей статью Сергея Петровича...
...Предисловие «Грамоты.ру» Сергей Петрович...
Портал In Science рассказал о базе данных, которую создала международная группа ученых. В этой базе задокументировано грамматическое разнообразие сотен языков мира.
...Портал In Science рассказал о базе данных, которую...
...Общество научных исследований имени Макса Планка (Германия...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Цифровые технологии сегодня позволяют превратить любое...
...«Семантическое издание — это представление...
Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...