Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В современном мире, чтобы язык сохранялся и полноценно функционировал, он должен быть представлен в интернете и на нем должен регулярно создаваться новый контент. Участники сессии обсудили разные способы реализации государственной политики в сфере поддержки языков коренных народов России в киберпространстве. Грамота выделила самое интересное.
...В современном мире, чтобы язык сохранялся и ...
...Александр Антонов, руководитель группы оценки качества...
Ответственный редактор монографии — академик Николай Николаевич Казанский, специалист по классической филологии и индоевропеистике. Книга рассчитана на широкий круг читателей, которые интересуются российской наукой и ее историей.
...Ответственный редактор монографии — академик...
...Институт лингвистических исследований имеет богатую...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя. Это справочно-информационная платформа, созданная на основе девяностотомного собрания сочинений Льва Толстого, которая дает пользователю возможность проводить поиск по огромному корпусу текстов писателя, предоставляет справочные материалы как для специалистов, так и для широкого круга читателей. 19 ноября 2024 года проект презентовал цифровую хронику жизни Льва Толстого, основанную на ...
...Проект «Слово Толстого» — цифровой...
Один из проектов обновленной Грамоты — Лексикон. В него попадают новые слова, которые уже вызывают живой интерес у наших пользователей (и не только), но еще не фиксируются академическими словарями. Как выбирать и описывать такие слова — вопрос, который сегодня актуален для портала. Эксперты и сотрудники Грамоты постарались ответить на него в режиме живой дискуссии. Предлагаем вам познакомиться с высказанными идеями.
...Один из проектов обновленной Грамоты — Лексикон...
...Зачем нужен Лексикон? Рабочий термин «Лексикон...
Мария Лебедева заведует лабораторией в Институте Пушкина и руководит образовательным направлением Грамоты. Она считает русский язык самым важным школьным предметом. Почему? И как сделать его живым, интересным и практически ценным для каждого школьника? Об этом она рассказала в лекции для преподавателей русского языка, прочитанной в рамках проекта «Тотальный диктант». Грамота предлагает краткий конспект этой лекции.
...Мария Лебедева заведует лабораторией в Институте...
...Как сегодня учат русскому языку в школе 1. Один...
Исследователи из Массачусетского технологического института (MIT) нашли объяснение так называемого U-образного эффекта, который характерен для больших языковых моделей вроде ChatGPT. Суть этого эффекта в том, что модели обрабатывают разные части текста с разной точностью. Чем дальше от центра текста, тем точность выше (отсюда и название — график точности имеет спад в центре, отчего становится похож на букву U). Что это означает? Например, если модели нужно ...
...Исследователи из Массачусетского технологического...
Сервисы обновленной Грамоты становятся более технологичными. Например, в них будут применяться нейронные сети. Руководитель ИИ-направления, компьютерный лингвист Михаил Копотев рассказал про основные направления работы и возможности новых технологий.
...Сервисы обновленной Грамоты становятся более технологичными...
...Грамота: Что изменится для пользователей в результате...
C начала 1990-х годов вслед за изменениями в обществе русский язык стал очень быстро меняться. Появилось много новых слов, причем они появились не сами по себе, а вслед за новыми понятиями, которые хлынули внезапно в нашу жизнь. Что мы ежедневно встречаем в интернете? Например, такую фразу: «Лайфстайл — это мощный инструмент в арсенале маркетолога, который используется для позиционирования бренда».
...C начала 1990-х годов вслед за изменениями в обществе...
...Грамота уже 25 лет наблюдает за жизнью русского языка...
Большие языковые модели (чат-боты на основе искусственного интеллекта, обученные на больших массивах языковых данных) могут порождать связные, осмысленные предложения и даже тексты, в чем многие уже могли убедиться на собственном опыте. Но насколько они способны «понимать» внутреннюю логику человеческого языка, остается неясным. К примеру, если такие модели в ходе обучения находят связи между буквами и словами, могут ли они отличить грамматически правильное ...
...Большие языковые модели (чат-боты на основе искусственного...