Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Как эволюционирует язык и как он связан с мышлением, почему языки умирают и можно ли их возродить, какую роль выполняют эмодзи в устно-письменном языке интернета — обо всем этом рассказала лингвист, член Орфографической комиссии РАН Мария Ровинская на канале «Мослекторий».
...Как эволюционирует язык и как он связан с ...
...Откуда возник язык? В науке существует огромное...
Разными исследователями, как нашими, так и зарубежными, неоднократно отмечалось, что дети, осваивающие какой-либо язык как родной (первый), и носители другого языка (инофоны), осваивающие тот же язык как второй, иногда допускают сходные ошибки, что, по-видимому, должно свидетельствовать о том, что стратегия построения первичной и вторичной языковой системы в определенном смысле совпадает. Однако, когда сопоставляются достаточно большие корпусы ошибок, это не подтверждается: среди ошибок, допускаемых инофонами, можно обнаружить некоторое количество «детских», но дети обычно не допускают ошибки, свойственные инофонам. Таким образом, можно говорить о несовпадении стратегий усвоения языка.
...Разными исследователями, как нашими, так и зарубежными...
...В качестве хорошо известных фактов можно привести правила...
Раскройте любое издание, включите любой телеканал — и перед вами развернутся целые миры, о существовании которых вы могли и не подозревать. «Глобальные» претензии современной рекламы (зачастую абсурдные) отображает московский рекламный еженедельник «Экстра М»: «Мир кожи в Сокольниках» и «Электромир», «Мир потолка», «Мир окон» и «Мир ванн» (это названия московских магазинов). Группа компаний «Инрост», продавая обогреватели, зовет в «Мир идеального климата», «Весь мир Canon в магазинах „Конверс“!», «Мир мобильной связи» и «Волшебный мир компьютеров» (это слоганы — рекламные девизы).
...Раскройте любое издание, включите любой телеканал ...
...Реклама — новая реальность И это современное...
Разделы книги отражают многообразные интересы автора: японистика, теория языка и типология, языковая политика и социолингвистика, а также история языкознания. Книга доступна для скачивания в формате pdf.
...Разделы книги отражают многообразные интересы автора...
...Отдельно отметим раздел «Лингвистические задачи...
Я не думаю, что в последние не то что двадцать пять, а в последние сто лет русский язык сильно менялся. Я слышал язык разных поколений, застал еще свою деревенскую прабабушку, которая училась в церковно-приходской школе и поэтому была грамотной. Она говорила на том же языке, на котором говорю я, на котором говорят мои дети и, надеюсь, будут говорить мои внуки.
...Я не думаю, что в последние не то что двадцать пять...
...Другое дело, что в русский язык все время приходят...
Найти слово сразу в нескольких словарях, сравнить результаты, проверить свою версию написания, произношения или толкования — посетители Грамоты всегда охотно пользовались этой возможностью. Но в некоторых случаях детали не нужны, а требуется, наоборот, быстро получить самое общее представление о слове. Руководитель словарного направления Грамоты Анастасия Александровна Бонч-Осмоловская объясняет, каким образом в метасловаре объединены и структурированы данные о слове и какие преимущества новый формат дает пользователям.
...Найти слово сразу в нескольких словарях, сравнить результаты...
...Метасловарь как агрегатор Задать вопрос справочной...
Необходимость заговорить с незнакомым человеком часто ставит нас в тупик. При всем желании найти вежливое, нейтральное, современное и уместное слово получается не всегда. «Товарищ» остался в СССР, «гражданин» звучит тревожно, «господин» режет слух, «женщину» и «мужчину» странно считать обращениями. Приходится признать, что в этом месте в русском языке есть проблема.
...Необходимость заговорить с незнакомым человеком...
...Раньше было проще Чтобы выбрать обращение, мы мгновенно...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...В последнее время искусственный интеллект далеко...
По итогам тестирования «Яндекс.Переводчик» лучше других языковых моделей и онлайн-переводчиков справился с переводом текста с английского на русский язык. DiBiMT (Disambiguation Biases in Machine Translation) — новый эталонный инструмент (бенчмарк) для оценки погрешностей при разрешении семантической неоднозначности в машинном переводе. Он позволяет подробно изучать ошибки при переводе имен и глаголов в языковых ...
...По итогам тестирования «Яндекс.Переводчик...