Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
В последние годы государство уделяет большое внимание языковой политике и законодательству о языке. Были приняты поправки к закону «О государственном языке», идет работа над созданием Национального словарного фонда, утверждена Концепция государственной языковой политики, есть программы сохранения языкового разнообразия России. Какие проблемы сейчас стоят перед обществом, если говорить о русском языке? Каким образом можно было бы эффективно повысить речевую культуру жителей страны? Об этом нам рассказал руководитель Грамоты, член Совета при президенте РФ по русскому языку Константин Деревянко.
...В последние годы государство уделяет большое внимание...
...Грамота: Вы уже много лет занимаетесь издательскими...
Инструкции, законы, юридические договоры, профессиональные статьи чаще всего написаны специфическим языком. Хотя мы принимаем это как должное, исследования показывают: такая практика вредит экономике и обществу в целом.
...Инструкции, законы, юридические договоры, профессиональные...
...Все мы при решении рабочих вопросов, чтении новостей...
Чужой опыт, рекомендации придерживаться определенных правил вряд ли могут сыграть решающую роль в такой свободолюбивой среде, как Глобальная Сеть. И все же наблюдение за процессом рождения правил поведения в интернете, которые заметно отличаются от этикета внесетевой реальности и уже даже получили специальное название — Netiquette, не только представляет академический интерес для лингвистов и культурологов, но и является важным с практической точки зрения.
...Чужой опыт, рекомендации придерживаться определенных...
...Ребенок воспитывался без родителей один, в интернете...
Пять книг, которые мы выбрали, предназначены для широкого круга читателей. Они свидетельствуют об интересе к происхождению русского письма, который сохранялся на протяжении всего XX века. Из них вы узнаете, как возникли привычные нам буквы, чем кириллица отличается от глаголицы и при чем здесь греки и финикийцы.
...Пять книг, которые мы выбрали, предназначены для широкого...
...1. Елена Уханова. У истоков славянской письменности...
Школьники не могут освоить правописание из-за скудного словарного запаса, а сами учителя иногда перенимают сленг учеников. Таковы результаты опроса участников олимпиады «Хранители русского языка». Правописание считают самым сложным разделом для изучения в школе 40% опрошенных учителей русского языка. На втором месте пунктуация (24%), а на третьем — культура речи и стилистика (23%). Распространенные причины проблем с русским языком — бедный словарный запас и ...
...Школьники не могут освоить правописание из-за скудного...
Инициатором выступило общественное движение «Всебурятская ассоциация развития культуры». О содержании проекта организаторы рассказали на пресс-конференции 22 апреля. Предполагается, что реалити-шоу «YЗЭсХЭЛЭНтэ буряад» («Учи язык») выйдет в эфир на телеканале «Буряад ТВ» в июне 2024 года. Участники должны будут за два месяца освоить основы разговорного бурятского языка. Команда победителей отправится на фестиваль ...
...Инициатором выступило общественное движение «...
Новый идеографический словарь должен стать дополнением к известному словарю избранных индоевропейских синонимов Карла Дарлинга Бака1, впервые изданному более семидесяти лет назад; вошедший в него материал славянских языков был представлен неполно и с неточностями. В словаре Бака представлены свыше тысячи значений (синонимических рядов) и лексика из разных индоевропейских языков. В новый словарь планируется включить гораздо больше значений. Будут приведены ...
...Новый идеографический словарь должен стать дополнением...
Многие из тех, кто учил иностранный язык в школе, признаются, что умеют рассуждать о мировой политике или защите окружающей среды, но теряются, когда нужно правильно назвать венчик для взбивания, определенный вид встроенного шкафа или шапочку с помпоном. В процессе перевода тоже возникают похожие трудности с конкретной лексикой, когда одним словом могут быть названы очень разные предметы. Переводчик с итальянского Анна Ямпольская рассказала Грамоте, на какие ухищрения приходится идти, чтобы отличить пиджак от куртки, а панаму от ушанки.
...Многие из тех, кто учил иностранный язык в школе, признаются...
...Как известно, костюм — одна из важнейших характеристик...