Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Кто бы ни брался за создание «расширительного» словаря того или иного типа, все непременно приходили к Далю — к этому великому человеку-словарю. Подавляющее большинство людей связывает имя Даля со знаменитым четырехтомником. Все остальное, что сделал, написал, пережил Владимир Иванович, заслонено его «Словарем».
...Кто бы ни брался за создание «расширительного...
...Весть из Вермонта В конце 1989 года в «Литературной...
Цифра — неотъемлемый элемент современного публицистического текста. Цифры зачастую красноречивее фактов говорят о событиях повседневной жизни. Оперируя десятью цифрами, можно выразить беспредельное множество чисел — количественных характеристик, без которых сегодня немыслимы публикации на темы экономики, статистики, финансовой политики. Без цифр нельзя представить и хронику спортивных соревнований. В то же время включение цифры в словесный текст часто приводит к очевидным ошибкам, которые не всегда можно объяснить невниманием, небрежностью или незнанием школьной грамматики. Корни многих наших затруднений лежат значительно глубже. Их следует искать в формировании языкового сознания, в особенностях восприятия текста, в истории языка, в истории нашей письменности, на которой мы остановимся подробнее.
...Цифра — неотъемлемый элемент современного...
... Часто говорят, что цифры управляют миром; нет...
Изначально этот текст, написанный лет десять назад и называвшийся «Заметки графофила», имел ограниченное хождение среди моих друзей и знакомых. Позднее бóльшая его часть под заголовком «„И пучину взворотила и поставила вверх дном“? (заметки об авторской пунктуации)» была опубликована в газете «Русский язык» (№ 7 за 2002 год). Сокращения коснулись отступления про «авторскую орфографию», а также материалов, найденных в интернете. Авторская орфография заслуживает отдельного обстоятельного разбора, текстов из интернета я и сейчас тоже почти не касаюсь.
...Изначально этот текст, написанный лет десять назад...
...За прошедшие десять лет интернет вырос многократно,...
Мы пользуемся языком, чтобы делиться информацией и обмениваться идеями. Гораздо сложнее понять, насколько язык необходим, чтобы мыслить. Сегодня есть данные, которые позволяют ученым утверждать, что язык и мышление существуют достаточно обособленно друг от друга. О новом исследовании рассказывает новостной портал Массачусетского технологического института.
...Мы пользуемся языком, чтобы делиться информацией и&...
...Интуитивные представления и научные факты Американский...
Как в точности соотносятся церковнославянский, старославянский и древнерусский языки? На это вопрос даже многие выпускники филологических факультетов не могут дать внятный ответ. При этом если древнерусский и старославянский остались в далеком прошлом, церковнославянский жив и сегодня, хотя и для ограниченного круга людей. Как сложилась его судьба и чем он интересен с лингвистической точки зрения? Об этом Грамота поговорила с ведущим научным сотрудником Института русского языка им. В. В. Виноградова РАН, руководителем научного центра по изучению церковнославянского языка и проекта создания Большого словаря церковнославянского языка Нового времени Александром Геннадьевичем Кравецким.
...Как в точности соотносятся церковнославянский, старославянский...
...Грамота: В чем все-таки разница между древнерусским...
Новый идеографический словарь должен стать дополнением к известному словарю избранных индоевропейских синонимов Карла Дарлинга Бака1, впервые изданному более семидесяти лет назад; вошедший в него материал славянских языков был представлен неполно и с неточностями. В словаре Бака представлены свыше тысячи значений (синонимических рядов) и лексика из разных индоевропейских языков. В новый словарь планируется включить гораздо больше значений. Будут приведены ...
...Новый идеографический словарь должен стать дополнением...
Статьи номера посвящены произношению согласных, восприятию диалекта, карнавализации, семантике глагольных циркумфиксов и слова «Земля», а также языку образов времени и языку художественной литературы. Отметим некоторые из них.
...Статьи номера посвящены произношению согласных, восприятию...
...К семантике русских глагольных циркумфиксов. Циркумфикс...
В этом году чемпионат проходит в России в четвертый раз. Это не совсем обычное соревнование: подростки могут здесь написать эссе по математике, трактат по физкультуре или концепцию музыкального фестиваля. О том, зачем понадобилась альтернатива школьному «итоговому сочинению», рассказал председатель экспертного жюри, доцент факультета гуманитарных наук НИУ ВШЭ и руководитель Лаборатории развития интеллектуальных состязаний Михаил Павловец.
...В этом году чемпионат проходит в России в четвертый...
...Грамота: В чем особенность вашего чемпионата, чем он...
В русском языке есть множество терминов для обозначения родства и близких духовных связей. Названия ближайших родственников всем хорошо знакомы и не вызывают никаких трудностей. Но вряд ли современный носитель языка с ходу сможет сказать, кто такие свояченица, деверь, шурин или невестка. Что означают эти загадочные термины и почему многие из них встречаются редко или вовсе перестали использоваться?
...В русском языке есть множество терминов для обозначения...
...Родственники Отношения родства охватывают как ближайших...