Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Наша кафедра теории, истории языка и прикладной лингвистики и Центр изучения народно-речевой культуры им. проф. Л. И. Баранниковой сейчас разрабатывают мультимедийный корпус диалектной речи. Корпус обеспечен многообразной системой поисковых запросов, основанной на специальной разметке диалектных текстов, включает аудио- и видеозаписи диалектной речи.
...Наша кафедра теории, истории языка и прикладной лингвистики...
...Диалектный корпус позволяет ставить и решать новые...
Существование и функционирование русского языка в российском сегменте интернета, безусловно, и заслуживает, и требует особого внимания. Хотя эта тема является во всех отношениях новой, неизученной, однако уже сейчас становится понятно, что в ближайшие годы она займет существенное место в языковедческих исследованиях.
...Существование и функционирование русского языка в российском...
...Прежде всего, необходимо определиться с терминологией...
26 июля отмечается День эсперанто — самого популярного международного искусственного языка, на котором говорит несколько миллионов человек. Создатель эсперанто Людвик Лазарь Заменгоф полагал, что грамматику этого языка можно выучить всего за один час. Как зародилась идея создания нейтрального языка общения и почему при таком большом сообществе говорящих на эсперанто он так и не стал по-настоящему международным?
...26 июля отмечается День эсперанто —...
...Надежды доктора Людвик Лазарь Заменгоф (известный...
Художественный стиль обязан своим существованием художественной литературе. Писатели и поэты пишут в этом стиле свои произведения. Из всех функциональных стилей художественный можно назвать самым неоднозначным. Есть исследователи, которые вообще не признают его как отдельное явление. Но главная проблема заключается в том, что у стиля художественной литературы то и дело возникают конфликты с литературной нормой.
...Художественный стиль обязан своим существованием художественной...
...Система образов воздействует на воображение и ...
Время от времени лингвист Ирина Фуфаева встречает в соцсетях слово какого — и вздрагивает. Казалось бы, это просто местоимение какой в родительном или винительном падеже. Но оно ей попалось, к примеру, в таком контексте: «Вот думаю, какого им в этом мире живется...» Автор поста, вполне интеллигентный айтишник, узнав из комментария, что здесь пишется каково, обрадовался и поблагодарил ее: «Спасибо, это не опечатка. Я реально не знал это правило».
...Время от времени лингвист Ирина Фуфаева встречает в...
...Но это не правило! В написании местоимения каков в...
Дать лингвистический комментарий проекта федерального закона о государственном языке — задача не из простых. Да, такой закон, безусловно, нужен. Но каковы его цели, в чем состоит, так сказать, его сверхзадача? Как должен быть сформулирован закон о языке, чтобы он не превратился в пустую бумажку или широковещательную и неконкретную декларацию? Вопросы, вопросы...
Доктор филологических наук Лев Скворцов анализирует текст проекта закона о государственном языке для «Литературной газеты».
...Дать лингвистический комментарий проекта федерального...
...О работе над этим законом я от своих коллег-филологов...
Язык за последние 25 лет не менялся никак. Ведь что такое язык? Многие люди ошибочно считают, что язык — это слова. Но язык — это не слова, а то, что соединяет слова посредством смысла, наша способность из слов создавать что-то пугающее или, наоборот, прекрасное.
...Язык за последние 25 лет не менялся никак. Ведь что...
...Грамота уже 25 лет наблюдает за жизнью русского языка...
Соглашаясь с необходимостью законодательного регулирования вопросов, связанных с государственным языком, лингвисты обращают внимание на необходимость уточнения положений закона о государственном языке РФ. Некоторые из них называют отправленный на доработку закон антинаучным, дилетантским и антижурналистским, другие принципиально выступают против законодательного регулирования словоупотребления.
...Соглашаясь с необходимостью законодательного регулирования...
...Текст закона требует уточнений Юрий Караулов ...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Девятнадцать лет назад в России появился электронный...
...Грамота: С какими целями создавался корпус? А. К.:...