Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Пользователи Грамоты часто задают справочной службе вопрос о том, как писать какое-нибудь слово — с большой или с маленькой? «Транссибирская» или «транссибирская» магистраль, «Танины» или «танины» вещи, «Председатель» или «председатель», и, наконец, «Вы» или «вы»? Выбор между строчной и прописной буквой в русском правописании действительно устроен непросто. Он во многом определяется традицией, а правила, которые его регулируют, несколько раз менялись.
...Пользователи Грамоты часто задают справочной службе...
...Без больших букв можно обойтись? Различие между строчными...
— Mama, sprich wie alle! — потребовал пятилетний Марк, сын моей русскоязычной знакомой, вернувшись из детского сада. И перестал разговаривать по-русски. Случай типичный. Ребенок не понимает, зачем ему нужен русский язык. Так возникает первая методическая проблема, с которой сталкивается преподаватель русского языка в диаспоре. Дальше проблемы идут косяком: времени на занятия мало, общение с окружающими ровесниками и взрослыми вытесняет из памяти ребенка язык русскоговорящих родителей.
...— Mama, sprich wie alle! — потребовал...
...Как мы ловили идею, которая носится в воздухе Чтобы...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Диалектный корпус позволяет ставить и решать новые...
Появление интернета как общедоступного пространства общения породило новое языковое разделение. Язык блогов, форумов и соцсетей, не скованный литературными и типографскими нормами, теперь существует параллельно с языком традиционных СМИ. Но граница между ними проницаема: медиа и сами живут на территории интернета, а «зумерский» сленг и новые понятия легко проникают в серьезные газеты и журналы.
...Появление интернета как общедоступного пространства...
...Чем отличается язык молодежи Традиционные СМИ ориентируются...
О том, как устроена проверка работ Тотального диктанта, по каким критериям его оценивают и как решают спорные вопросы, рассказала главный редактор издательства «Грамота» и председатель московской экспертной комиссии Тотального диктанта Ольга Згировская.
...О том, как устроена проверка работ Тотального...
...Кто проверяет Значительную часть проверяющих составляют...
Российская Федерация — многонациональное государство. На ее территории функционируют более 150 языков, из которых около ста — языки коренных народов России, остальные — это языки компактно или диаспорно проживающих некоренных этносов. Полиэтничность Российского государства выражена в начальных строках Конституции: «Мы — многонациональный народ России».
...Российская Федерация — многонациональное...
...Государственно-политические аспекты лингвокультурной...
Раскройте любое издание, включите любой телеканал — и перед вами развернутся целые миры, о существовании которых вы могли и не подозревать. «Глобальные» претензии современной рекламы (зачастую абсурдные) отображает московский рекламный еженедельник «Экстра М»: «Мир кожи в Сокольниках» и «Электромир», «Мир потолка», «Мир окон» и «Мир ванн» (это названия московских магазинов). Группа компаний «Инрост», продавая обогреватели, зовет в «Мир идеального климата», «Весь мир Canon в магазинах „Конверс“!», «Мир мобильной связи» и «Волшебный мир компьютеров» (это слоганы — рекламные девизы).
...Раскройте любое издание, включите любой телеканал ...
...Реклама — новая реальность И это современное...
Революция нейросетей началась с текста. Но в будущем, вероятно, его роль как носителя знаний будет уменьшаться. На смену ему придут текстографические форматы, и это позволит людям быстрее понимать задачи и достигать взаимопонимания. Об этом в интервью Грамоте размышляет специалист по цифровой гуманитаристике, доктор физико-математических наук Константин Воронцов.
...Революция нейросетей началась с текста. Но в ...
...Грамота: В 2024 году Нобелевскую премию по...
26 июля отмечается День эсперанто — самого популярного международного искусственного языка, на котором говорит несколько миллионов человек. Создатель эсперанто Людвик Лазарь Заменгоф полагал, что грамматику этого языка можно выучить всего за один час. Как зародилась идея создания нейтрального языка общения и почему при таком большом сообществе говорящих на эсперанто он так и не стал по-настоящему международным?
...26 июля отмечается День эсперанто —...
...Надежды доктора Людвик Лазарь Заменгоф (известный...