Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Проблемы, которые мы здесь обсуждаем, в конечном итоге сводятся к оценке состояния русского языка, и зеркалом этого состояния является язык средств массовой информации. Само слово «состояние» заряжено негативной оценкой, предполагает какие-то дефекты в предмете. Ср. «состояние больного внушает опасения», «состояние конструкции здания чревато опасностями» и т. п. Но когда мы говорим о состоянии языка, мы разве озабочены разрушением его морфологического строя? Или нас настораживают изменения в его фонетике, в его синтаксисе?
...Проблемы, которые мы здесь обсуждаем, в конечном итоге...
...Нет, структурная его организация вполне благополучна...
В разных контекстах Вильгельм фон Гумбольдт подчеркивал различные аспекты языка. Отсюда — его разные определения. В контексте же настоящей статьи для нас имеют главное значение два гумбольдтовских понимания языка — деятельностно-речевое («Язык есть деятельность») и системно-знаковое («Язык есть система знаков»). Из первого из них вытекает возможность проследить, в каком соотношении в учении Гумбольдта находятся семасиологизм и ономасиологизм, а из второго — в каком соотношении в нем представлены язык и речь.
...В разных контекстах Вильгельм фон Гумбольдт подчеркивал...
...В отличие от Фердинанда де Соссюра (1857&ndash...
Изначально этот текст, написанный лет десять назад и называвшийся «Заметки графофила», имел ограниченное хождение среди моих друзей и знакомых. Позднее бóльшая его часть под заголовком «„И пучину взворотила и поставила вверх дном“? (заметки об авторской пунктуации)» была опубликована в газете «Русский язык» (№ 7 за 2002 год). Сокращения коснулись отступления про «авторскую орфографию», а также материалов, найденных в интернете. Авторская орфография заслуживает отдельного обстоятельного разбора, текстов из интернета я и сейчас тоже почти не касаюсь.
...Изначально этот текст, написанный лет десять назад...
...За прошедшие десять лет интернет вырос многократно,...
В справочную службу Грамоты пишет недоумевающий пользователь: «...Меня резко поправили, когда я спросила „кто последний“ (в очереди), сказали, что в русском языке так говорить не принято, а нужно „кто крайний“». На самом деле все как раз наоборот. Неправильно спрашивать в очереди «кто крайний» и не стоит, предлагая гостю сесть, говорить «присаживайтесь» (грамотно «садитесь»).
...В справочную службу Грамоты пишет недоумевающий...
...Мы не случайно объединили два этих мифа в один...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
В последнее время все чаще высказывается мнение о том, что слово «Интернет» надо писать со строчной (маленькой) буквы. Основной аргумент сторонников такого написания: Интернет стал единой, всемирной, общераспространенной информационной сетью, таким же общепринятым средством передачи информации, как, например, телефон.
...В последнее время все чаще высказывается мнение о том...
...Пишем же мы это слово со строчной буквы! Но справедлива...
От чего зависит наше отношение к грамматическим ошибкам в чужой устной речи? Ответ дает новое исследование, проведенное научными группами из Бирмингемского и Кардиффского университетов (оба — Великобритания) в сотрудничестве с Нови-Садским университетом (Сербия). Авторов интересовало, как акцент говорящего и личностные черты слушающего влияют на оценку речи. В исследовании приняли участие 60 носителей британского английского (поровну ...
...От чего зависит наше отношение к грамматическим...
О том, как устроена проверка работ Тотального диктанта, по каким критериям его оценивают и как решают спорные вопросы, рассказала главный редактор издательства «Грамота» и председатель московской экспертной комиссии Тотального диктанта Ольга Згировская.
...О том, как устроена проверка работ Тотального...
...Кто проверяет Значительную часть проверяющих составляют...
В течение первого года жизни нейропластичность максимальна: в это время формируется больше всего новых нейронов и связей между ними. Исследователи давно предполагали, что с самого раннего возраста мозг младенцев, родившихся в монолингвальных и билингвальных семьях, работает по-разному в том, что касается обработки речи. Однако ограничения в технологиях не позволяли понять, что происходит непосредственно в мозге, когда ребенок слышит речь. Группа ...
...В течение первого года жизни нейропластичность...