Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Завершился очередной этап совершенствования инструментов, которыми можно пользоваться на Грамоте. Сегодня расскажем о самых заметных изменениях в том, что касается поиска. 1. Теперь на странице поиска есть тумблер, который позволяет переключаться между точным и умным поиском. По умолчанию ищется точное совпадение с тем запросом, который ввел пользователь в строке поиска: ровно те же знаки в том же порядке, без учета словоформ и похожих вариантов (тумблер ...
...Завершился очередной этап совершенствования инструментов...
Заметки филолога Бориса Шварцкопфа о знаменитой цитате из «Ревизора», опубликованные в «Русской речи» (1968, № 6).
...Заметки филолога Бориса Шварцкопфа о знаменитой цитате...
...Как известно, Хлестаков, расхваставшись перед чиновниками...
Ежегодная лекция о новых находках состоялась 20 ноября 2023 года. Академик РАН Алексей Гиппиус, продолжая традицию, начатую его учителем, Андреем Анатольевичем Зализняком, рассказал о результатах раскопок прошедшего сезона: о пятнадцати новгородских грамотах и четырех грамотах из Старой Руссы. Трансляцию можно посмотреть на канале Института славяноведения РАН.
...Ежегодная лекция о новых находках состоялась 20 ноября...
...Самая древняя из найденных в 2023 году новгородских...
До сих пор не теряют популярности псевдолингвистические теории искателей «славянских рун» и тайных смыслов в русских буквах. Филолог и преподаватель Светлана Гурьянова, автор книги «В начале было кофе» и блога «Восстание редуцированных», прочитала лекцию о том, как на самом деле славяне получили письменность, и показала на примерах, в чем ошибались лингвисты-любители.
...До сих пор не теряют популярности псевдолингвистические...
...Если ввести в интернете запрос «древняя...
В ноябре пользователи интересовались, среди прочего, тем, как произносится слово «кафе», как правильно писать названия разных видов сумок и как расставить знаки препинания в сложном предложении, которое стало предметом спора.
...В ноябре пользователи интересовались, среди прочего...
...Произношение Вопрос: Почему в слове кафе ф произносится...
Перемены в языке не в последнюю очередь связаны с переменами в обществе. Подтверждение этому тезису можно найти как в истории, так и в окружающей нас действительности. Газеты, радио, телевидение сыплют «пиарами», «траншами», реклама глушит «чумовыми джок-дайлами», «офшорами» и «таймшерами». Мы все больше привыкаем к вхождению в наш повседневный язык большого количества новых слов иноязычного происхождения, но, привыкая к ним, хорошо бы отдавать себе отчет в правильности и уместности их употребления, а зачастую и в элементарном понимании значения того или иного слова.
...Перемены в языке не в последнюю очередь связаны...
...Уже второй год, отправляя студентов на практику, я...
Даже тот, кто не посвятил жизнь науке, сталкивается с текстами, написанными в научном стиле. Любой реферат или доклад, учебник или научно-популярный блог использует особые языковые средства, которые отвечают его задачам. Текст в этом функциональном стиле не просто передает информацию, но стремится доказать ее истинность, ценность, а во многих случаях и новизну.
...Даже тот, кто не посвятил жизнь науке, сталкивается...
...Три подстиля для разных задач Традиционно выделяют...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...В 2023 году проект «Национальный корпус русского...
На самом деле этот подкаст — не совсем о русском языке. Девятнадцать коротких выпусков — это истории о том, каким путем в русский язык попали разные непонятные слова и что они означают. Несмотря на некоторые лингвистические неточности, эти увлекательные истории расширяют наше понимание современной речи. Чтобы дать представление о содержании подкаста, опишем вкратце содержание двух выпусков.
...На самом деле этот подкаст — не совсем о...
...Тема первого выпуска — англицизмы,...