Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Александр Александрович Реформатский вошел в историю отечественной лингвистики прежде всего как автор неоднократно переиздававшегося учебника для филологических вузов «Введение в языковедение». Но ему принадлежит и ряд других трудов, оставивших заметный след в науке о языке. В памяти же современников, его коллег и учеников он остался как необыкновенно колоритная и своеобразная личность, как человек, производивший на собеседников яркое впечатление не только всем своим обликом и манерой поведения, но и своей речью.
...Александр Александрович Реформатский вошел в историю...
...«А ведь так, как говорит Реформатский, не говорит...
В любом высказывании есть информация, которая не выражается никакими материальными знаками, а вычисляется слушателем. От нее зависит глубина понимания этого высказывания, а иногда и дальнейшие действия участников коммуникации. Одна из областей, где слушателю нужно приложить усилия для понимания предложения, — «восстановление» невыраженных субъектов. По каким правилам это делается и как их применять? Об этом Грамоте рассказала доктор филологических наук Галина Ивановна Кустова.
...В любом высказывании есть информация, которая...
...Проезжаю я, а слетает шляпа: где искать субъекта...
Новые технологии «отвязали» текст не только от бумажного носителя, но и от букв, и теперь у нас есть возможность выбирать между собственно чтением и слушанием. У каждого способа есть свои преимущества и ограничения, но в целом восприятие текста мало зависит от того, по какому каналу — зрительному или слуховому — он попадает в наш мозг.
...Новые технологии «отвязали» текст не только...
...Начало. Чтение вслух Письменность появилась примерно...
Всем, кто имеет отношение к организации Тотального диктанта, творчество Евы Даласкиной знакомо отлично. Еще в 2015 году кто-то из «диктаторов» произнес: «Сейчас мы напишем текст Е. Водолазкина», — а кто-то из «диктантеров» записал имя автора так: «Ева Даласкина». С тех пор все нелепицы, которые обнаруживают проверяющие в текстах диктанта, приписываются этой авторессе.
...Всем, кто имеет отношение к организации Тотального...
...Заслуженная популярность Ева Даласкина, будем честны...
Идея панславизма захватила умы в XIX веке на волне национальных движений. Но мысль о необходимости преодолеть религиозное и языковое разобщение славян зародилась гораздо раньше. Еще в XVII веке хорватский богослов, философ, лингвист и историк Юрий Крижанич попытался создать единый славянский язык.
...Идея панславизма захватила умы в XIX веке на ...
...Славянский полиглот Юрий Крижанич родился в 1618...
Технологии стремительно развиваются и всё больше влияют на нашу жизнь. Сегодня важная часть досуга огромного количества людей — компьютерные игры. Внутри сообщества геймеров давно сложился свой жаргон, который может быть непонятен тем, кто далек от игровых сообществ. При этом некоторые слова из этой сферы стали употребляться гораздо шире и вошли в молодежный сленг и разговорную речь.
...Технологии стремительно развиваются и всё больше...
...Что мы называем жаргоном В лингвистике под...
«Зубодробительный», «заумный», «трескучий» — так говорят про язык законов, инструкций, договоров и соглашений. Мы привыкли мириться с ним, раз «так нужно». Но государство и бизнес наконец сами задумались о том, чтобы говорить проще. Какие есть инструменты, которые им в этом помогут?
...«Зубодробительный», «заумный»...
...Какой язык называют простым Простой язык (plain language...
Грамота решила не ограничиваться в 2024 году толкованием слова вайб и проделала аналогичную работу с теми словами, которые особенно часто появлялись в запросах наших пользователей. Это имена существительные маркетплейс, стендап, буллинг, худи, чекап, инфлюенсер, абьюз, абьюзер, вишлист, гойда, кипиш, кринж, а также имена собственные «Ютуб» и «Ватсап», которые получили широкое распространение и фактически употребляются как нарицательные. На примере пяти новых слов мы покажем, что у нас получилось.
...Грамота решила не ограничиваться в 2024 году толкованием...
...В лаборатории лексикографа В рамках проекта «...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...