Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Русский язык стал таким, каким мы его знаем сегодня, не сразу. Он прошел долгий путь, впитывая в себя конструкции церковного языка, народные говоры и иностранные заимствования. Правила грамотной речи тоже не появились сами собой. И здесь велика роль ученых, которые формировали представление о языковой норме. Одним из первых таких систематизаторов был Мелетий Смотрицкий.
...Русский язык стал таким, каким мы его знаем сегодня...
...Интеллектуал Нового времени Максим Герасимович Смотрицкий...
Вступившие в силу 1 марта поправки в законодательство ограничивают использование заимствований, прежде всего англицизмов, появившихся за последние два десятка лет. Что-то уже ясно, а что-то остается предметом дискуссий и прояснится только с появлением правоприменительной практики. Мы постарались выделить и обсудить те стороны новой ситуации, которые вызывают больше всего вопросов.
...Вступившие в силу 1 марта поправки в законодательство...
...Рамки закона Одна из целей нынешнего этапа реализации...
Когда нужно двоеточие? Ответ на экзамене, за который ставится высокая оценка, включает пункт о двоеточии между обобщающим словом и однородными членами, правило постановки двоеточия в бессоюзном предложении при определенном значении частей и интонации, правила введения в предложение прямой речи. Вспоминают иногда о возможности постановки двоеточия в сложносочиненном предложении (ССП), хотя это и редкий и необязательный знак в ССП.
...Когда нужно двоеточие? Ответ на экзамене, за который...
...Вопрос о возможности двоеточия в сложноподчиненном...
Лев Киселев (RE-pac) — популяризатор рэп-фристайла в России. Читает рэп уже лет двадцать, шестнадцать лет занимается фристайлом и почти столько же преподает его, а последние девять лет руководит «Фристайл-мастерской». Кто-то ходит в нее годами, кто-то приходит посмотреть, а кто-то — остается. Грамота расспросила его о том, как научиться рифмовать на ходу и какая от этого польза.
...Лев Киселев (RE-pac) — популяризатор рэп-фристайла...
...Грамота: Что такое рэп-фристайл? Лев Киселев: Фристайл...
В русском языке ударение устроено довольно сложно. Знание ударений проверяется на ЕГЭ по русскому языку: школьники должны выучить все формы из Орфоэпического словника. А вы сможете верно определить, где должны стоять ударения в словосочетаниях, которые мы составили из этих слов?
...В русском языке ударение устроено довольно сложно...
В журнале «Неофилология» вышла статья филологов Ольги Ребковец и Натальи Милянчук о том, как изменилась система жанров научно-популярного изложения в связи с развитием технологий. Авторы рассматривают, какую цель преследует тот или иной текст и какие коммуникативные позиции занимают автор и адресат.
...В журнале «Неофилология» вышла статья...
...С начала XXI века объем текстов в научно-популярном...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
В блоке команды чат-бота BotHub на портале «Хабр» вышла статья о том, может ли машинный интеллект находить и исправлять ошибки в русскоязычном тексте, как настоящий корректор. Для испытания автор отобрал 13 популярных инструментов — от передовых языковых моделей до специализированных корректорских сервисов.
...В блоке команды чат-бота BotHub на портале...
...Методология Автор стремился выжать из ИИ-корректоров...
Знать правила расстановки кавычек необходимо не только школьникам и писателям, но и тем, кто составляет договоры, инструкции, экспликации для выставок, объявления. Общие принципы усвоить нетрудно, а вот умение применять их к месту достигается тренировкой. В сложных случаях пригодится языковое чутье и внимательное отношение к стилю.
...Знать правила расстановки кавычек необходимо не только...
...Виды кавычек В русской (и не только) пунктуации есть...