Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Восьмое марта — противоречивый праздник: начался он с борьбы за равноправие женщин, а продолжается под пожелания «быть мужу воздухом весенним, быть летним солнцем для детей». Рассказать о том, как обстоят дела с неравноправием в языке, и выбрать подходящие поздравления с Женским днем, Грамоте помог Валерий Ефремов — доктор филологических наук, заведующий кафедрой русского языка филологического факультета РГПУ им. А. И. Герцена, соведущий программы «Как это по-русски» на «Радио России Петербург».
...Восьмое марта — противоречивый праздник:...
...Поэтка и блогерка против мастера маникюра Главные...
Предлагаем вниманию читателей портала статью, опубликованную в журнале «Русский язык в школе» (№ 3, 1954). Чем отличаются друг от друга историзмы и архаизмы, в чем разница между лексическими и семантическими архаизмами? С какой целью их используют писатели? На эти вопросы отвечает Николай Максимович Шанский, с 1963-го по 2005 год — главный редактор журнала.
...Предлагаем вниманию читателей портала статью, опубликованную...
...Предисловие «Грамоты.ру» Николай Максимович...
Фраза «Не опять, а снова!» — речевая ошибка? Можно ли употреблять слово «обратно» в значении «опять»? Эти вопросы обсуждаются в журнале «Наука и жизнь».
...Фраза «Не опять, а снова!» — речевая...
...Слова опять и снова обозначают повторение действия....
Кандидата филологических наук Юлию Сафонову заинтересовало происхождение русского просторечного слова шалберничать. О том, как развивались значения однокоренных с ним слов, она пишет в журнале «Наука и жизнь».
...Кандидата филологических наук Юлию Сафонову заинтересовало...
...В XVIII веке в русском языке появляется слово шалбер...
Изучение систем коммуникации животных по понятным причинам долгое время ограничивалось наблюдениями. Затем появилась аппаратура, записывающая аудио- и видеоинформацию, возникла идея экспериментального подхода, и, наконец, на помощь специалистам пришли цифровые технологии и искусственный интеллект. Грамота рассказывает, как специалисты сегодня применяют эти методы и что узнаю́т с их помощью.
...Изучение систем коммуникации животных по понятным причинам...
...Наблюдение, слежка и прослушка Чтобы что-то понять...
Предки русских, англичан, французов, иранцев, армян, таджиков, греков, части народов Индии и других народов много тысяч лет назад говорили на одном языке, который ученые называют праиндоевропейским. Так что русский язык — не только славянский, о чем всем известно; он также входит в большую и пеструю семью потомков праиндоевропейского языка. В чем проявляется это родство?
...Предки русских, англичан, французов, иранцев, армян...
...Индоевропейские языки и другие языковые семьи...
«Я клянусь говорить по-русски». Плакат с такой надписью, сделанной разноцветными фломастерами, можно увидеть в средней школе города Александрии в американском штате Вирджиния. Летом здесь прошли курсы русского языка для школьников и преподавателей РКИ. На них побывала филолог, журналист Ксения Туркова. В интервью нашему порталу она рассказала о том, почему американские школьники стремятся изучать русский язык, знают ли в США Грамоту и как борщи и павловопосадские платки помогают заговорить на языке Толстого и Чехова.
...«Я клянусь говорить по-русски». Плакат...
...«Ты крутая, если знаешь русский язык»...
Анна Пестова, научный сотрудник отдела современного русского языка Института русского языка им. В. В. Виноградова РАН, и Левон Саакян, доцент кафедры общего и русского языкознания Государственного института русского языка им. А. С. Пушкина, пообщались с нейросетью и делятся этим опытом. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...Анна Пестова, научный сотрудник отдела современного...
...Посмотрев видео, вы узнаете: чем отличаются запросы...
Большинство нейросетевых языковых моделей обучаются на огромных массивах данных — в основном англоязычных, так как текстов на этом языке больше всего. При этом модели — если их дообучить — вполне могут генерировать тексты на других языках и делать переводы на эти языки, несмотря на то, что данных на этих языках, пригодных для обучения моделей, значительно меньше. Языковым моделям удается обходить эти ограничения благодаря тому, что они используют ...
...Большинство нейросетевых языковых моделей обучаются...