Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В ЕГЭ по русскому языку станет допустимым прибегать к интерпретации сюжета мультфильма, аниме, манги, комикса, графического романа или компьютерной игры. Об этом говорится в опубликованном на сайте Федерального института педагогических измерений (ФИПИ) «Навигаторе самостоятельной подготовки к экзамену». Использовать подобные аргументы можно будет в задании 27, в котором требуется написать сочинение по прочитанному тексту. В
...В ЕГЭ по русскому языку станет допустимым прибегать...
Изначально этот текст, написанный лет десять назад и называвшийся «Заметки графофила», имел ограниченное хождение среди моих друзей и знакомых. Позднее бóльшая его часть под заголовком «„И пучину взворотила и поставила вверх дном“? (заметки об авторской пунктуации)» была опубликована в газете «Русский язык» (№ 7 за 2002 год). Сокращения коснулись отступления про «авторскую орфографию», а также материалов, найденных в интернете. Авторская орфография заслуживает отдельного обстоятельного разбора, текстов из интернета я и сейчас тоже почти не касаюсь.
...Изначально этот текст, написанный лет десять назад...
...За прошедшие десять лет интернет вырос многократно,...
Книга филолога, прозаика и литературного критика, заслуженного профессора МГУ Владимира Новикова «Слов модных полный лексикон» рассказывает о новых словах и выражениях, которые вошли в моду в первой четверти XXI века. Из нее можно узнать не только о лексических новациях последних лет, но и о том, какие слова были в ходу еще недавно.
...Книга филолога, прозаика и литературного критика, заслуженного...
...На рубеже XX и XXI веков Владимир Новиков выпустил...
«Мировое языковое разнообразие крайне велико и, насколько я могу судить по своему опыту, большинством людей недооценивается», — утверждает Калеб Эверетт во введении к книге «Мириады языков». С его точки зрения, существование языковых универсалий вызывает сомнения, а представление о естественном языке слишком сильно перекошено в сторону хорошо знакомых нам европейских языков. Чем интересна эта книга и почему ее стоит прочитать? Рассказывает социолингвист и научный редактор книги Валерий Шульгинов.
...«Мировое языковое разнообразие крайне велико...
...Органичное сочетание двух подходов На лекциях о языковых...
В финале за звание столицы акции боролись три города: Омск, Томск и Челябинск. Победителя организаторы объявили 1 февраля. Победитель конкурса «Столица Тотального диктанта» — помимо официального статуса — получает право принять на главной площадке автора текста диктанта (в этом году им стала писательница Анна Матвеева), а также организовать студию онлайн-марафона и научно-популярные мероприятия, сопровождающие акцию. Юбилейный ...
...В финале за звание столицы акции боролись три города...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Организаторы определили дату следующей акции «Тотальный диктант». Она пройдет 20 апреля 2024 года в двадцатый раз, сообщает ТАСС. Автора объявят в прямом эфире 8 сентября, в Международный день грамотности. В этот же день начнется отбор городов для участия в конкурсе «Столица Тотального диктанта». В 2023 году столицей диктанта был Нижний Тагил, а до этого — Санкт-Петербург, Якутск и Ярославль. Тотальный диктант впервые состоялся в 2004 году как акция студентов ...
...Организаторы определили дату следующей акции «...
Новый сервис создала компания SberDevices — партнер Сбера. По данным разработчиков, модель на основе искусственного интеллекта обучена на примерах, покрывающих большинство часто встречающихся источников текста и их особенностей: новости, социальные сети, отзывы, субтитры, интернет-страницы, блоги и статьи. Сервис поддерживает только русский язык и не исправляет пунктуацию — она остается на усмотрение автора. Объем текста, который можно загружать для ...
...Новый сервис создала компания SberDevices &mdash...
Практически всем приходится время от времени заниматься заполнением документов, будь то трудовой договор, претензия к производителю товара или заявление о замене счетчиков воды. Такие тексты написаны в специфическом узнаваемом стиле, который называется официально-деловым. Каковы особенности этого стиля и почему он склонен к экспансии?
...Практически всем приходится время от времени заниматься...
...Из истории отечественного делопроизводства Традиция...