Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Изучение речи русских эмигрантов свидетельствует об угасании письменной формы русского языка в среде выходцев из России, получивших образование не на русском языке. Зарубежные русские, пользующиеся русским языком как средством лишь устного общения, — это чаще всего высокообразованные эмигранты первой волны, вывезенные малолетними детьми, или их потомки, родившиеся за рубежом. У них нет навыков письменного общения на русском языке, или эти навыки очень незначительны.
...Изучение речи русских эмигрантов свидетельствует об...
...Такие люди свободно говорят и пишут на других языках...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...
Полчаса на редактуру мало, редактирование — медленный процесс. Но скорость жизни в последнее десятилетие повысилась, а количество текстов увеличилось. Типичный редакторский кошмар: «У меня всего полчаса на этот текст». Наш чек-лист поможет сосредоточиться, когда приближается дедлайн, а вы не знаете, за что хвататься.
...Полчаса на редактуру мало, редактирование &mdash...
...Максимум возможного за минимум времени Развитие цифровых...
Случалось ли вам заменять корректное написание ошибочным по наитию, потому что вам вдруг померещилось правило, которое нужно обязательно применить? Или слово показалось слишком простым, и вы решили на всякий случай добавить буквы, чтобы оно выглядело солиднее? Такие исправления «из лучших побуждений» иногда возникают даже в речи очень грамотных людей.
...Случалось ли вам заменять корректное написание ошибочным...
...Что лингвисты называют гиперкоррекцией Некоторые ошибки...
Лингвист Максим Кронгауз дал два интервью: каналу «Основа» и каналу «Поговорим про РКИ (русский язык как иностранный)». Речь шла о том, почему приставки в русском языке более «живые», чем в романских, чем обращения в русском отличаются от других языков, как на естественный язык повлияет искусственный интеллект и чем интересен новояз из романа Джорджа Оруэлла «1984».
...Лингвист Максим Кронгауз дал два интервью: каналу &...
...1. Приставка в русском языке способна быть центром...
Каждый из нас общается по-разному в зависимости от ситуации и статуса собеседника. Невозможно говорить с начальником так же, как со своим приятелем. Точно так же подчеркнутая и несколько формальная вежливость неуместна в компании близких друзей. Каким образом вежливость проявляется на уровне языка? И в чем тут своеобразие разных языков?
...Каждый из нас общается по-разному в зависимости...
...Западная вежливость В лингвистике грамматическая...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Каждый из нас сталкивался с ситуацией, когда в тексте или в разговоре попадалось незнакомое слово. Найти его значение и узнать, в каких контекстах его употребляют, может помочь толковый словарь. Как появился этот тип словарей и для чего еще они могут быть полезны?
...Каждый из нас сталкивался с ситуацией, когда в...
...Что такое толковый словарь Толковые словари &...
Этой осенью Грамота вступает в эпоху перемен. В чем будут заключаться эти перемены? Какая идея стоит за ними? И, самое главное, будет ли Грамота по-прежнему самым авторитетным сетевым источником сведений о русском языке? О смысле обновления и планах на будущее рассказывает главный редактор портала Ксения Киселева.
...Этой осенью Грамота вступает в эпоху перемен. В чем...
...Маска, я вас знаю? В ноябре 2023 года Грамоте исполнится...