Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Публицистический стиль речи — один из функциональных стилей, который используется в ситуациях, когда нужно не просто донести информацию, но и повлиять на читателя или слушателя, сформировать мнение по поводу общественно важного вопроса. Этот стиль можно встретить не только в СМИ, но и в речах политиков или в книгах.
...Публицистический стиль речи — один из функциональных...
...Место среди других стилей Образность и выразительность...
В прошлом году мы уже анализировали несуществующие слова, которые наши читатели пытались найти на портале, и хотим продолжить эту традицию. Наши коллеги выбрали для нас самые удивительные запросы пользователей, а мы попробовали пофантазировать, как возникли эти слова и что они могли бы значить.
...В прошлом году мы уже анализировали несуществующие...
...Под окказионализмами обычно понимают слова, которые...
Родству языков посвящена такая область лингвистики, как сравнительно-историческое языкознание, или компаративистика. Ученые сравнивают родственные языки между собой, прослеживают эволюцию, реконструируют общий праязык. Один из инструментов для оценки степени родства языков разработал американский лингвист Моррис Сводеш. Его так и называют — список Сводеша.
...Родству языков посвящена такая область лингвистики,...
...Жизнь и карьера Морриса Сводеша Моррис Сводеш...
Самые простые и распространенные пиктограммы могут стать источником неловкости в общении. Но и совсем отказаться от эмодзи было бы обидно — они делают наши послания и реакции более живыми, эмоциональными, облегчают контакт, помогают «не отстать от жизни». Тогда как нам ориентироваться в этом вавилонском столпотворении символов? Как общаться на языке эмодзи, не рискуя быть неправильно понятым?
...Самые простые и распространенные пиктограммы могут...
...Этот материал — часть совместного проекта Грамоты...
Даже грамотные носители русского языка сталкиваются с трудностями, когда им нужно написать редкое, длинное, заимствованное или просто незнакомое слово. Да, в современные устройства встроена автоматическая проверка орфографии, но она не всегда работает корректно и не помогает, когда мы (такое тоже бывает!) пишем важный текст от руки. В случае сомнений всегда лучше свериться со словарем — желательно с самым новым.
...Даже грамотные носители русского языка сталкиваются...
...Что такое орфография Термин орфография восходит к&...
Гендерная проблематика явилась для лингвистики последних десятилетий подлинным открытием, хотя для ряда языков (например, японского, корейского, чукотского и др.) разделение языка на мужской и женский варианты было обыденным явлением, незаметным, как воздух, которым дышит человек (конечно, до поры до времени незаметным).
...Гендерная проблематика явилась для лингвистики последних...
...Европейские языковеды наперегонки бросились открывать...
Даже тот, кто не посвятил жизнь науке, сталкивается с текстами, написанными в научном стиле. Любой реферат или доклад, учебник или научно-популярный блог использует особые языковые средства, которые отвечают его задачам. Текст в этом функциональном стиле не просто передает информацию, но стремится доказать ее истинность, ценность, а во многих случаях и новизну.
...Даже тот, кто не посвятил жизнь науке, сталкивается...
...Три подстиля для разных задач Традиционно выделяют...
Программисты из Югры работают над нейросетью, аналогичной ChatGPT, которая могла бы помочь чиновникам в написании законопроектов. Об этом в интервью газете «Вестник Сургутского района» рассказал директор департамента информационных технологий и цифрового развития, заместитель губернатора ХМАО Павел Ципорин. Разработкой занимается Югорский НИИ информационных технологий. «У нас возникла гипотеза, что мы можем обучить нейросетевую модель на наших ...
...Программисты из Югры работают над нейросетью, аналогичной...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...