Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Нас с детства учат, что ругаться нехорошо, некультурно, а бранные слова «плохие» и даже могут нас «запачкать». Но ругательства есть во всех живых языках, потому что человеку свойственно выражать с их помощью эмоции — причем не только отрицательные, но и положительные. Как в языке появляются слова, выполняющие эту «грязную работу»? И можно ли сделать так, чтобы они не приносили никому вреда?
...Нас с детства учат, что ругаться нехорошо, некультурно...
...Источники плохих слов Ругательства могут различаться...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...
В июне наша справочная служба побила все рекорды и ответила на 865 вопросов пользователей! Из них мы выбрали четыре, чтобы рассказать об одном из проявлений игровой природы языка, напомнить правила написания названий некоторых редакторских профессий и разобраться с дробными числительными и существительными, которыми они управляют.
...В июне наша справочная служба побила все рекорды и&...
...Управление Вопросы: 1. Как правильно следует...
Орфографическая чувствительность — одно из уникальных человеческих свойств, связанное с восприятием письменной речи. Эта способность позволяет отличать не только слова от случайных наборов букв, но и правильно написанные слова от слов с ошибками. Чувствительность к орфографическому облику слова начинает формироваться обычно в младшем школьном возрасте, когда дети осваивают письмо. А в каком возрасте реакция на ошибки доводится до автоматизма? Это ...
...Орфографическая чувствительность — одно...
Сложно организованные сообщества требуют сложных систем коммуникации. Хотя многие животные выработали свои способы обмена информацией, можно ли сказать, что хоть один из видов приблизился в этом к людям? Исследователи из Лаборатории искусственного интеллекта Массачусетского технологического института и международной инициативы CETI изучили вокализации (звуковые сигналы) кашалотов и пришли к выводу, что они похожи на настоящий язык. Авторы работы отталкивались от ...
...Сложно организованные сообщества требуют сложных систем...
Приятель брата — Митя или Дима? А новая коллега — Женя или Евгения? Анна Ивановна считает себя начальником или начальницей? Как описать соседа: он глухой или с нарушениями слуха? Во многих ситуациях нам приходится делать этот непростой выбор. На что лучше ориентироваться: на мнение того, о ком речь, на правила языка или на собственное удобство? Грамота расспросила об этом популяризатора лингвистики, кандидата филологических наук Александра Пиперски.
...Приятель брата — Митя или Дима? А новая...
...Выбор имени: родители, святцы и другие алгоритмы...
Проблемы специфики существования русского языка в так называемой зоне интернета — это, безусловно, обширное белое даже не пятно, а просто-таки поле в современной русистике. Путешествуя по разным любопытным ссылкам, я узнала, что этот вопрос обсуждается довольно активно.
...Проблемы специфики существования русского языка в так...
...Так, на сайте «Редактор.ру» можно задать...
Русский язык не только вещь в себе, но и вещь в нас и вокруг нас. Меня давно уже интересует проблема взаимодействия русского языка с языками наук, языками искусств и разными видами человеческой деятельности.
...Русский язык не только вещь в себе, но и ...
...Недавно мы с Георгием Борисовичем Шабатом1 закончили...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...