На международной конференции по искусственному интеллекту AI Journey разработчики Сбера анонсировали новую версию GigaChat. Это нейросеть, способная справляться со сложными задачами, в том числе развернуто отвечать на вопросы, придумывать сюжеты, переписывать и редактировать тексты. В основе новой версии лежит одна из наиболее продвинутых лингвистических моделей для русского языка, в которой учитываются 29 миллиардов параметров: их число определяет способность нейросети точно и быстро ...
...моделей для русского языка, в которой учитываются 29 миллиардов...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...в которых в сумме содержится более двух миллиардов...
За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».
...За двадцать лет Национальный корпус русского языка...
...Сегодня в корпус входит несколько миллиардов словоупотреблений...
Анализируя опыт защиты родного языка в аудиовизуальных средствах зарубежных стран, обратимся к примеру Франции, которая является одним из пионеров электронных СМИ и где принцип свободы печати был закреплен законом еще в 1881 году. Публичная демонстрация телеприемника состоялась в 1931 году, а в 1935-м Эйфелева башня стала самой мощной телевизионной станцией в мире. Много лет автор этой статьи работал собкором советского телевидения и радио во Франции, и на его глазах формировалась нынешняя система контроля над всей сетью французского телевидения и радиовещания.
...Анализируя опыт защиты родного языка в аудиовизуальных...
...статистическим данным, французы ежегодно тратят около 25 миллиардов...
Инструменты, о которых пойдет речь ниже, не сделают всю работу за редактора, но способны существенно упростить ему жизнь. Они не только возьмут на себя рутинные задачи, такие как проверка орфографии и степени оригинальности текста, оформление списка литературы или замена кавычек, но и подскажут удачные решения в более сложных областях.
...Инструменты, о которых пойдет речь ниже, не сделают...
...прописью» и наслаждайтесь результатом: восемь миллиардов...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
...МОСКОВСКИЕ СЫЩИКИ НЕ ДАЛИ ПОХИТИТЬ 20 МИЛЛИАРДОВ...
Как бы преподаватель ни относился к заимствованным словам, он должен научить студента правильно и уместно пользоваться этой лексикой. Для этого нужно объяснять не только значения заимствованных слов, но и их сочетаемость, системно-языковые отношения с синонимами, антонимами, родо-видовыми и тематическими включениями в родственные лексические группы.
...Как бы преподаватель ни относился к заимствованным...
...с американцами — общая граница, свыше сотни миллиардов...
В мире насчитываются тысячи языков, на которых говорят миллиарды людей. И тем не менее энтузиасты продолжают изобретать все новые искусственные языки разной степени проработанности — от пары фраз до полноценного словаря и грамматики. На какие группы делятся сконструированные языки — конланги — и для кого они предназначены?
...В мире насчитываются тысячи языков, на которых...
...Какие бывают конланги Одни конланги основаны на уже...
Грамотные люди вызывают у окружающих сложные чувства. С одной стороны, они пользуются авторитетом, к ним испытывают уважение. С другой, грамотная устная и письменная речь некоторым кажется излишеством: раз меня все равно понимают, зачем мучиться и учить правила? Кроме того, одни, как принято думать, обладают врожденной грамотностью, а другие не могут справиться с буквами из-за дислексии и дисграфии. И все-таки грамотность сегодня становится таким же полезным навыком, как умение строить отношения с коллегами или говорить на иностранном языке. Какая грамотность нам нужна в эпоху спелл-чекеров и чатботов? Попробуем подступиться к этой важной теме.
...Грамотные люди вызывают у окружающих сложные чувства...
...Правильно писать, читать и говорить Слова грамотность...