Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
Благодя цифровизации науки многие полезные справочные ресурсы доступны в электронном виде. Институт лингвистических исследований РАН в Санкт-Петербурге ведет большую работу по созданию лингвистических корпусов, баз данных, указателей, в том числе посвященных русскому языку. Грамота рекомендует пять ресурсов, которые будут полезны как специалистам-филологам, так и любителям.
...Благодя цифровизации науки многие полезные справочные...
...Современные онлайн-ресурсы расширяют возможности исследователей...
...1. Новое в русской лексике База данных снабжена...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Нейросеть выучилась понимать язык без использования...
...Большие языковые модели — нейросети, способные...
21 февраля в мире отмечается Международный день родного языка. Его задача — напомнить о ценности всех тех языков, которые достались нам в наследство. Когда родной язык народа уходит из общественной жизни, ему грозит превращение в набор отдельных слов и обрывочных рассказов, интересующих лишь исследователей. Эта угроза существует и для языков некоторых коренных народов России. Но современные технологии дают таким языкам надежду.
...21 февраля в мире отмечается Международный день родного...
...Как цифровизация помогает сохранить языки коренных...
...Родные языки в опасности Языки выходят из употребления...
Уральцы гордятся тюркизмом «айда», Сибирь — мультифорой, про питерский поребрик и парадные слышали все. Нет человека, которого бы не увлекала тема региональных слов. Лингвист Ирина Фуфаева рассказывает о словах, которые не переводятся на язык других регионов.
...Уральцы гордятся тюркизмом «айда», Сибирь...
...«Я купила сотню мух»: регионализмы, у которых нет аналогов...
...Внутри региональной лексики есть много отдельных интересных...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...Как отличить текст, написанный нейросетью? Ряд критериев...
...В последнее время искусственный интеллект далеко...
Слова, у которых изменилось написание, выбор между «слитно» и «раздельно», новые или разговорные слова, которых еще нет в словарях, — все это сложные случаи, которые могут вызвать затруднения даже у очень грамотных кандидатов филологических наук. Давайте познакомимся поближе с этими опасными экземплярами.
...Слова, у которых изменилось написание, выбор между...
...Слова Шрёдингера и как с ними справляться...
...Старая новая норма «Почему в книге 1952&...
Для нескольких поколений наших соотечественников Ушаков — что-то вроде названия словаря (есть еще Даль и Ожегов). Образованные люди знают, что «посмотреть в Ушакове» означает получить точную, надежную, подробную информацию о значениях слов и их стилистических оттенках. А ведь этого словаря могло и не быть. Профессору Московского университета Дмитрию Николаевичу Ушакову пришлось преодолеть множество препятствий в борьбе за дело своей жизни. Лекция заведующей кафедрой медиаречи ...
...«Посмотреть в Ушакове», или Как человек становится...
...Для нескольких поколений наших соотечественников Ушаков...
Найти слово сразу в нескольких словарях, сравнить результаты, проверить свою версию написания, произношения или толкования — посетители Грамоты всегда охотно пользовались этой возможностью. Но в некоторых случаях детали не нужны, а требуется, наоборот, быстро получить самое общее представление о слове. Руководитель словарного направления Грамоты Анастасия Александровна Бонч-Осмоловская объясняет, каким образом в метасловаре объединены и структурированы данные о слове и какие преимущества новый формат дает пользователям.
...Найти слово сразу в нескольких словарях, сравнить результаты...
...В метасловаре пользователь сначала видит общую картину...
...Метасловарь как агрегатор Задать вопрос справочной...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов рассказывают о слове «дабы», причём выясняют, что оба варианта его произношения узаконены авторитетными словарями.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
...Дабы...