Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...
Премию имени М. В. Ломоносова I степени за научные работы Ученый совет МГУ присудил Наталье Лукашевич — доктору технических наук, ведущему научному сотруднику НИВЦ МГУ и профессору кафедры теоретической и прикладной лингвистики филологического факультета. Наталья Лукашевич создала цикл статей о методах автоматического анализа текстов на русском языке (включая их классификацию, извлечение информации, анализ тональности, семантический анализ и другие виды аналитической обработки ...
...Премию имени М. В. Ломоносова I степени за научные...
В разных контекстах Вильгельм фон Гумбольдт подчеркивал различные аспекты языка. Отсюда — его разные определения. В контексте же настоящей статьи для нас имеют главное значение два гумбольдтовских понимания языка — деятельностно-речевое («Язык есть деятельность») и системно-знаковое («Язык есть система знаков»). Из первого из них вытекает возможность проследить, в каком соотношении в учении Гумбольдта находятся семасиологизм и ономасиологизм, а из второго — в каком соотношении в нем представлены язык и речь.
...В разных контекстах Вильгельм фон Гумбольдт подчеркивал...
...В отличие от Фердинанда де Соссюра (1857&ndash...
В статье рассматриваются проблемы теории и истории языкознания рубежа XIX–XX веков, получившие развитие в трудах видного лингвиста Дмитрия Николаевича Кудрявского (1867–1920). Автор обращает особое внимание на обзор научных идей, изложенных в новаторском курсе лекций «Введение в языковедение», их связь с новыми тенденциями в отечественной и мировой науке начала XX века и подчеркивает их значение для осмысления последующей лингвистической традиции в России. В статье приведены также малоизвестные факты сотрудничества Д. Н. Кудрявского с «Энциклопедическим словарем» Брокгауза и Ефрона.
...В статье рассматриваются проблемы теории и истории...
...Только постоянное нарушение живой речью устанавливаемых...
«Зубодробительный», «заумный», «трескучий» — так говорят про язык законов, инструкций, договоров и соглашений. Мы привыкли мириться с ним, раз «так нужно». Но государство и бизнес наконец сами задумались о том, чтобы говорить проще. Какие есть инструменты, которые им в этом помогут?
...«Зубодробительный», «заумный»...
...Какой язык называют простым Простой язык (plain language...
Предлагаем вашему вниманию статью Романа Робертовича Гельгардта, опубликованную в журнале «Русский язык в школе» (№ 3, 1968). Что мешает читателю текста в точности понять смысл, заложенный автором? Что имел в виду Пушкин в строке «Вина кометы брызнул ток» и почему при чтении стихов Брюсова читатель может вспомнить химическую формулу HDO?
...Предлагаем вашему вниманию статью Романа Робертовича...
...Предисловие «Грамоты.ру» Роман Робертович...
В России бок о бок с русскими столетиями живут другие коренные народы. Неизбежное в такой ситуации культурное взаимовлияние отразилось и на языке. Известно, что такие слова, как «казна», «деньги», «таможня» и многие другие, имеют тюркское происхождение и связаны с ордынским владычеством. А какие заимствованные из русского языка слова вошли в языки народов России? Для примера возьмем якутский, татарский, чеченский и коми-пермяцкий языки.
...В России бок о бок с русскими столетиями живут другие...
...Русский язык, будучи государственным, не мог не повлиять...
Наша чувствительность к языкам — удивительная черта, которая позволяет нам быстро овладевать речью. Считается, что раннее освоение языка состоит из двух этапов. В ходе первого младенцы учатся отличать звуки родительского языка от посторонних звуков, другими словами, развивают чувствительность к звучанию именно того языка, на котором будут говорить. Этот процесс принято называть перцептивной настройкой (от perception — восприятие, схватывание). На втором этапе ребенок ...
...Наша чувствительность к языкам — удивительная...
На сайте Русского географического общества опубликовано интервью с кандидатом филологических наук, старшим научным сотрудником Института языкознания РАН и специалистом по лингвистической картографии Юрием Коряковым.
...На сайте Русского географического общества опубликовано...
...Идея создания «Карты языков России» возникла...