Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Носители языка не всегда могут уследить за тем, что лингвисты тщательно фиксируют в словарях, правда, всегда с опозданием: одни слова вдруг появляются ниоткуда или становятся модными в силу ситуации, а другие постепенно выходят из употребления, устаревают и исчезают. У переводчика в этом отношении есть преимущество: он смотрит на чужой язык со стороны и более чувствителен к изменениям. Переводчик-японист Екатерина Тарасова рассказала Грамоте о новых явлениях в японском языке.
...Носители языка не всегда могут уследить за тем, что...
...В Японии очень внимательно относятся к неологизмам....
Появление интернета изменило в том числе и привычные способы взаимодействия со словарями: мы чаще смотрим слово в интернете, чем заглядываем в бумажные книги. К тому же лексика меняется очень быстро, так что всеми любимый словарь Ожегова уже перешел в разряд исторических, а многие новые слова и значения в словарях пока не отражены. О том, каким будет комплексный верифицированный словарь русского языка на цифровой платформе, рассказала доктор филологических наук Мария Каленчук, главный научный сотрудник Института русского языка им. В. В. Виноградова РАН и руководитель проекта «Национальный словарный фонд».
...Появление интернета изменило в том числе и привычные...
...Что такое Национальный словарный фонд: концепция и...
В нашем обществе существует множество мифологических представлений о русском языке и его истории. Это связано с особенностями современного медиапространства: с одной стороны, информация о языке нередко искажается в СМИ; с другой стороны, широкие возможности для построения ошибочных теорий и их распространения предоставляет интернет. Нелингвисты, как правило, не всегда понимают, в чем разница между языком и правописанием, что такое норма языка и кто ее фиксирует, почему происходят изменения в ...
...В нашем обществе существует множество мифологических...
Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке.
...Сотрудники Лаборатории цифровой лингвистики МИФИ Александра...
...До нас дошел очень большой массив рукописей на церковнославянском...
Зачем вообще люди ругаются нецензурными словами? Что такое языковые табу? Как возникла и развивалась табуированная лексика в русском языке? Почему люди стали чаще пользоваться эвфемизмами вместо мата и хорошо ли это? Все эти волнующие общество темы лингвист, член Орфографической комиссии РАН, доцент кафедры русского языка Московского архитектурного института и эксперт Грамоты Мария Ровинская обсудила с ведущим подкаста Григорием Тарасевичем.
...Зачем вообще люди ругаются нецензурными словами? Что...
...Ведущий сразу предупредил, что матерные слова будут...
Летняя лингвистическая школа — это выездное научное мероприятие, в котором участвуют школьники, студенты и преподаватели. В течение десяти дней несколько десятков человек, интересующихся лингвистикой, учатся, общаются, отдыхают и работают над научными проектами. Преподают в Летней школе ведущие ученые-лингвисты и популяризаторы науки. Кроме собственно лингвистических лекций на ЛЛШ проводятся лекции по математике, антропологии, переводоведению и
...Летняя лингвистическая школа — это выездное...
Одной из любопытных особенностей современных СМИ является широкое использование устаревшей лексики, что обусловлено социокультурными и политическими переменами, происходящими в нашем обществе. Новая социокультурная ориентация проявляется, в частности, в том, что новые явления и предметы общественной жизни получают названия, существовавшие в дореволюционной политической лексике: Дума, губернатор, суд присяжных и другие.
...Одной из любопытных особенностей современных СМИ является...
...До недавнего времени эти слова и выражения рассматривались...
Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...
...Как и люди, системы искусственного интеллекта...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Диалектный корпус позволяет ставить и решать новые...