Генеративные нейросети обучаются на огромных объемах данных, что позволяет им создавать осмысленные тексты за секунды. При этом они явно перенимают от своих «учителей» не только хорошее. Исследователи из Массачусетсского технологического института проанализировали случаи намеренного обмана и манипуляций со стороны больших языковых моделей и моделей, обученных под специфические задачи (например, видеоигры или торги на рынке). Выяснилось, что даже когда моделям на этапе ...
...Генеративные нейросети обучаются на огромных объемах...
В любой библиотеке мира словари русского языка будут занимать бесконечные ряды полок. Найти можно все: от словаря языка Пушкина до словаря названий рыб. Что ждет словари в XXI веке: останутся ли они памятниками прошлого или обретут новую жизнь благодаря цифровым технологиям? Лингвист, руководитель ИИ-направления Грамоты Михаил Копотев описал для нас в общих чертах три с лишним века русской лексикографии.
...В любой библиотеке мира словари русского языка будут...
...Лексиконы эпохи Просвещения выражали новые понятия...
За последние несколько недель прошла волна мероприятий и публикаций по поводу русского языка, словно давняя озабоченность наконец-то оформилась в конкретные мысли и отчетливые намерения. Это прежде всего акция «Народный диктант», инициаторы которой — журналисты «Российской газеты» — поставили эксперимент на себе и тем самым заслужили право предложить проверить свои знания по русскому языку отечественным чиновникам и политикам всех уровней и ветвей власти. За диктантом «по Льву Толстому» последовали выступления известных языковедов и деятелей культуры о русском языке как родном, как языке межнационального общения и как одном из мировых языков.
...За последние несколько недель прошла волна мероприятий...
...Однако на самом деле широкую общественность и филологическое...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Кажется, что машины начали вести с нами диалог совсем недавно. На самом деле их история насчитывает несколько десятилетий. Сам термин «чат-бот» появился в 1994 году — его предложил компьютерный инженер Майкл Молдин. А идея программного обеспечения, способного взаимодействовать с людьми на естественном языке, родилась гораздо раньше. Грамота рассказывает о том, как разработчики в разные годы пытались научить бездушные машины общаться по-человечески.
...Кажется, что машины начали вести с нами диалог...
...Работа по сценарию Разработчики будущих чат-ботов...
Наше представление о том, что для изучения языка необходимы словари и грамматика, существовало не всегда. Опираясь на «Историю русской письменности» филолога Виктора Марковича Живова, попробуем разобраться, как текстологический подход к языковой норме оказался вытеснен грамматическим и как это повлияло на нашу письменную традицию.
...Наше представление о том, что для изучения языка необходимы...
...Тексты как ориентир и южнославянское влияние Литературный...
На международной конференции по искусственному интеллекту AI Journey разработчики Сбера анонсировали новую версию GigaChat. Это нейросеть, способная справляться со сложными задачами, в том числе развернуто отвечать на вопросы, придумывать сюжеты, переписывать и редактировать тексты. В основе новой версии лежит одна из наиболее продвинутых лингвистических моделей для русского языка, в которой учитываются 29 миллиардов параметров: их число определяет способность нейросети точно и быстро ...
...На международной конференции по искусственному интеллекту...
В СССР активно боролись за права женщин, но при этом названия многих профессий в русском языке чаще всего употребляются в мужском роде. Как передовые идеи равенства полов вписались в российский патриархальный контекст? И почему женщины обычно предпочитают, чтобы их называли врачами и медиками, а не врачихами и медичками?
...В СССР активно боролись за права женщин, но при этом...
...Тема русских феминитивов обширна и остроактуальна;...
Появление интернета как общедоступного пространства общения породило новое языковое разделение. Язык блогов, форумов и соцсетей, не скованный литературными и типографскими нормами, теперь существует параллельно с языком традиционных СМИ. Но граница между ними проницаема: медиа и сами живут на территории интернета, а «зумерский» сленг и новые понятия легко проникают в серьезные газеты и журналы.
...Появление интернета как общедоступного пространства...
...Чем отличается язык молодежи Традиционные СМИ ориентируются...
Наш мозг любит находить знакомые шаблоны — в том числе в языке. Иногда это приводит к забавным и живучим ошибкам в понимании происхождения слов. Рассказываем, как народная этимология переписывает историю слов и почему мы так легко верим «альтернативным» версиям.
...Наш мозг любит находить знакомые шаблоны — в...
...1. Слишком простое объяснение: богадельня &mdash...