Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Грамота решила не ограничиваться в 2024 году толкованием слова вайб и проделала аналогичную работу с теми словами, которые особенно часто появлялись в запросах наших пользователей. Это имена существительные маркетплейс, стендап, буллинг, худи, чекап, инфлюенсер, абьюз, абьюзер, вишлист, гойда, кипиш, кринж, а также имена собственные «Ютуб» и «Ватсап», которые получили широкое распространение и фактически употребляются как нарицательные. На примере пяти новых слов мы покажем, что у нас получилось.
...Грамота решила не ограничиваться в 2024 году толкованием...
...В лаборатории лексикографа В рамках проекта «...
В мире насчитываются тысячи языков, на которых говорят миллиарды людей. И тем не менее энтузиасты продолжают изобретать все новые искусственные языки разной степени проработанности — от пары фраз до полноценного словаря и грамматики. На какие группы делятся сконструированные языки — конланги — и для кого они предназначены?
...В мире насчитываются тысячи языков, на которых...
...Какие бывают конланги Одни конланги основаны на уже...
Скороговорки из народной забавы превратились в инструмент исправления дикции, постановки профессиональной речи и изучения языка. Рассказываем, какие бывают скороговорки, чем полезны логопедические скороговорки, как преподавателям помогают скороговорки на английском, китайском и других языках.
...Скороговорки из народной забавы превратились в ...
...Откуда возникли скороговорки Скороговорки в разных...
«Зубодробительный», «заумный», «трескучий» — так говорят про язык законов, инструкций, договоров и соглашений. Мы привыкли мириться с ним, раз «так нужно». Но государство и бизнес наконец сами задумались о том, чтобы говорить проще. Какие есть инструменты, которые им в этом помогут?
...«Зубодробительный», «заумный»...
...Какой язык называют простым Простой язык (plain language...
Специалисты из Кембриджа разгадали загадку средневековой рукописи, которая более 130 лет ставила в тупик исследователей. Открытие не только помогло разрешить противоречие в знаменитых «Кентерберийских рассказах», но и показало, как средневековые священники уже в XII веке использовали популярную культуру — то, что современные исследователи называют мемами — для связи с паствой. В центре исследования оказалась проповедь ...
...Специалисты из Кембриджа разгадали загадку средневековой...
Языки отличаются друг от друга фонетикой, грамматикой, синтаксисом, способами организации лексических значений. Мы привыкли считать нормой то, как говорим мы сами, поэтому чем больше в чужом языке отличий от нашего, тем больше удивления он у нас вызывает. Попробуем посмотреть на русский язык глазами иностранца: что он отмечает в первую очередь, с какими проблемами сталкивается, когда начинает учить наш язык?
...Языки отличаются друг от друга фонетикой, грамматикой...
...Фонетические мучения Носителей итальянского, испанского...
Баски, уже многие сотни лет живущие в предгорьях Пиренеев на границе Испании и Франции (именно в их честь получил свое название Бискайский залив), — удивительный и загадочный народ, культура и язык которого совсем не похожи на культуру и языки других народов Южной Европы. Вот и правила образования числительных (да и сами их названия) в баскском языке весьма своеобразны. Предлагаем решить лингвистическую задачу про баскские числительные, опубликованную в журнале «Наука и жизнь».
...Баски, уже многие сотни лет живущие в предгорьях Пиренеев...
...Даны арифметические примеры на умножение на баскском...
Представьте себе, что вам нужно расплатиться в книжном магазине, а в кошельке остались две монеты одинакового номинала, равного стоимости книги. Одна сделана из чистого золота, а другая — всего лишь из меди. Какую из них вы решитесь потратить? Лингвист Валерий Шульгинов проводит аналогию между вытеснением ценной монеты из оборота и хорошими словами, которые перестают использоваться не по своей вине.
...Представьте себе, что вам нужно расплатиться в ...
...Худшие и лучшие слова Стремление людей тратить менее...
«Русская классика» — относительно новый корпус в составе Национального корпуса русского языка. Мы поговорили с одним из его создателей, компьютерным лингвистом Борисом Ореховым о том, почему классику выделили из Основного корпуса, чем она интересна и каковы перспективы развития этого проекта.
...«Русская классика» — относительно...
...Грамота: Почему было решено выделить произведения русских...