В мире насчитываются тысячи языков, на которых говорят миллиарды людей. И тем не менее энтузиасты продолжают изобретать все новые искусственные языки разной степени проработанности — от пары фраз до полноценного словаря и грамматики. На какие группы делятся сконструированные языки — конланги — и для кого они предназначены?
...В мире насчитываются тысячи языков, на которых...
...Какие бывают конланги Одни конланги основаны на уже...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Анализируя опыт защиты родного языка в аудиовизуальных средствах зарубежных стран, обратимся к примеру Франции, которая является одним из пионеров электронных СМИ и где принцип свободы печати был закреплен законом еще в 1881 году. Публичная демонстрация телеприемника состоялась в 1931 году, а в 1935-м Эйфелева башня стала самой мощной телевизионной станцией в мире. Много лет автор этой статьи работал собкором советского телевидения и радио во Франции, и на его глазах формировалась нынешняя система контроля над всей сетью французского телевидения и радиовещания.
...Анализируя опыт защиты родного языка в аудиовизуальных...
...До начала восьмидесятых годов телевидение и радио во...
На международной конференции по искусственному интеллекту AI Journey разработчики Сбера анонсировали новую версию GigaChat. Это нейросеть, способная справляться со сложными задачами, в том числе развернуто отвечать на вопросы, придумывать сюжеты, переписывать и редактировать тексты. В основе новой версии лежит одна из наиболее продвинутых лингвистических моделей для русского языка, в которой учитываются 29 миллиардов параметров: их число определяет способность нейросети точно и быстро ...
...На международной конференции по искусственному интеллекту...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...
За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».
...За двадцать лет Национальный корпус русского языка...
...Первые корпусы появились в 1960-х годах, но тогда...
Включение интернет-сленга в авторитетные лексикографические издания отражает процесс естественной эволюции языка под влиянием цифровых платформ. Недавний пример — обновление словника Кембриджского словаря, в который вошли понятия из интернет-культуры последних лет. Skibidi — слово, которое может иметь различные значения, такие как «крутой» или «плохой», либо использоваться в качестве шутки. Термин приобрел популярность благодаря вирусному анимационному ...
...Включение интернет-сленга в авторитетные лексикографические...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Всё чаще можно слышать, что большие языковые модели вроде ChatGPT «пишут как люди». На первый взгляд их способность имитировать нашу речь действительно потрясает. Но более пристальный научный анализ все же выявляет различия. Научная группа из Университета Карнеги — Меллона (США) проверила с помощью методов корпусного анализа, насколько созданные человеком тексты отличаются от текстов в тех же жанрах и стилях, но созданных языковыми моделями (LLM).
...Всё чаще можно слышать, что большие языковые модели...