Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Пожалуй, из всего того огромного количества слов, которые были в последние годы заимствованы русским языком, едва ли не самые жаркие споры, связанные с постановкой ударения, вызвало существительное «маркетинг», пришедшее из английского. Тех, кто выбирает вариант «марке́тинг», нередко обвиняют в безграмотности. Главный довод сторонников «ма́ркетинга»: так произносится это слово в языке-источнике.
...Пожалуй, из всего того огромного количества слов, которые...
...Удивляет многих носителей языка и несоответствие...
К языку средств массовой информации в последние годы читающей либо слушающей публикой и изучающими его специалистами-филологами предъявляются многочисленные и, увы, чаще всего вполне обоснованные претензии. Публику раздражает или шокирует, а специалистам кажется неоправданным или даже неприемлемым многое: и перенасыщение языка СМИ американизмами, и обилие в нем жаргонной, «блатной» и даже матерной лексики, и нарушение нормального темпа и нормативного интонационного рисунка речи.
...К языку средств массовой информации в последние годы...
...Кое-какие из этих претензий можно счесть, конечно,...
Мы с несколькими коллегами работаем над новым двуязычным русско-немецким и немецко-многоязычным (в том числе русским) онлайн-словарем синтаксических фразеологизмов. В течение следующего года мы планируем достичь объема триста словарных статей по каждому из двух языков и опубликовать первую версию словаря, но будем продолжать над ним работать и его пополнять.
...Мы с несколькими коллегами работаем над новым двуязычным...
...Синтаксические фразеологизмы-конструкции представляют...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...
По случаю обновления Грамоты мы решили напомнить нашим читателям, как появился этот интернет-ресурс, как он развивался и в чем всегда оставался верен себе. Об основных вехах долгой истории Грамоты расскажет свидетель и один из главных участников событий, научный сотрудник Института русского языка им. В. В. Виноградова РАН, многолетний главный редактор, а ныне научный руководитель Грамоты Владимир Маркович Пахомов.
...По случаю обновления Грамоты мы решили напомнить нашим...
...«Если книг читать не будешь, скоро грамоту забудешь...
Анализируя опыт защиты родного языка в аудиовизуальных средствах зарубежных стран, обратимся к примеру Франции, которая является одним из пионеров электронных СМИ и где принцип свободы печати был закреплен законом еще в 1881 году. Публичная демонстрация телеприемника состоялась в 1931 году, а в 1935-м Эйфелева башня стала самой мощной телевизионной станцией в мире. Много лет автор этой статьи работал собкором советского телевидения и радио во Франции, и на его глазах формировалась нынешняя система контроля над всей сетью французского телевидения и радиовещания.
...Анализируя опыт защиты родного языка в аудиовизуальных...
...До начала восьмидесятых годов телевидение и радио во...
В блоке команды чат-бота BotHub на портале «Хабр» вышла статья о том, может ли машинный интеллект находить и исправлять ошибки в русскоязычном тексте, как настоящий корректор. Для испытания автор отобрал 13 популярных инструментов — от передовых языковых моделей до специализированных корректорских сервисов.
...В блоке команды чат-бота BotHub на портале...
...Методология Автор стремился выжать из ИИ-корректоров...
Инициатором выступило общественное движение «Всебурятская ассоциация развития культуры». О содержании проекта организаторы рассказали на пресс-конференции 22 апреля. Предполагается, что реалити-шоу «YЗЭсХЭЛЭНтэ буряад» («Учи язык») выйдет в эфир на телеканале «Буряад ТВ» в июне 2024 года. Участники должны будут за два месяца освоить основы разговорного бурятского языка. Команда победителей отправится на фестиваль ...
...Инициатором выступило общественное движение «...