Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Нас с детства учат, что ругаться нехорошо, некультурно, а бранные слова «плохие» и даже могут нас «запачкать». Но ругательства есть во всех живых языках, потому что человеку свойственно выражать с их помощью эмоции — причем не только отрицательные, но и положительные. Как в языке появляются слова, выполняющие эту «грязную работу»? И можно ли сделать так, чтобы они не приносили никому вреда?
...Нас с детства учат, что ругаться нехорошо, некультурно...
...Источники плохих слов Ругательства могут различаться...
Есть ситуации, в которых отношения между словами можно выразить разными способами. Например, можно сказать «учебник истории», а можно «учебник по истории». В последнее время способ, при котором используется предлог, становится основным — это явление иногда называют экспансией предлогов. При этом значение многих предлогов размывается, а сами они все чаще выражают не лексические отношения, а более абстрактные грамматические. Мы решили повнимательнее присмотреться к конструкциям с «по» и «для», а потом обсудить наши наблюдения со специалистом.
...Есть ситуации, в которых отношения между словами...
...Расширение зоны ответственности предлогов В публицистических...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Сериал «Слово пацана», который активно обсуждают уже почти два месяца, заинтересовал нас не только словом «чушпан», которое даже называли в качестве кандидата на роль слова года. Насколько точно на экране передан сленг улицы в целом? Грамота поговорила об этом Шамилем Идиатуллиным, который в 1980-е годы жил в городе Брежнев (ныне Набережные Челны) и написал об этом времени книгу.
...Сериал «Слово пацана», который активно...
...В «Слове пацана» есть хорошая фактическая...
Инструменты, о которых пойдет речь ниже, не сделают всю работу за редактора, но способны существенно упростить ему жизнь. Они не только возьмут на себя рутинные задачи, такие как проверка орфографии и степени оригинальности текста, оформление списка литературы или замена кавычек, но и подскажут удачные решения в более сложных областях.
...Инструменты, о которых пойдет речь ниже, не сделают...
...Проверка орфографии Автоматическая проверка орфографии...
Благодаря социальным сетям и другим цифровым инструментам коммуникации новые слова сегодня входят в язык быстрее, чем когда-либо. И, как выясняется, активнее всего в этом процессе участвуют молодые женщины. Социолингвист Уильям Лабов долгое время исследовал языковые различия между мужчинами и женщинами и пришел к выводу, что женщины ответственны за 90% языковых изменений, — будь то новые слова, распространение новых речевых формул или изменение ...
...Благодаря социальным сетям и другим цифровым инструментам...
Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...
...Как и люди, системы искусственного интеллекта...
Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке.
...Сотрудники Лаборатории цифровой лингвистики МИФИ Александра...
...До нас дошел очень большой массив рукописей на церковнославянском...
Борьба с иностранными заимствованиями в русском языке — не первый случай отторжения чужого. В истории есть много примеров, когда власти ставили масштабные эксперименты над языком в попытке уберечь его от внешних угроз, очистить, сохранить его самобытность и красоту. Такая политика носит название лингвистического пуризма.
...Борьба с иностранными заимствованиями в русском...
...Исландия: язык как историческое наследие В XIX...