Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
Люди давно поняли, что записывать слова от руки — слишком трудоемкий процесс. Чтобы быстро делиться большими объемами информации, нужно было этот процесс упростить и ускорить. И вот примерно полтора века назад решение было найдено. С тех пор человечество стучит по клавишам.
...Люди давно поняли, что записывать слова от руки &mdash...
...«Ремингтон» и скорописец Английский инженер...
Большую часть своей жизни в науке я занималась теоретической фонетикой и фонологией, развивая идеи Московской фонологической школы. Но в последние годы я увлеклась проблемами кодификации произносительных норм. И есть один аспект, связанный с произносительными рекомендациями в орфоэпических словарях, который меня и тревожит, и раздражает, — это отсутствие данных о процедуре принятия кодификационных решений, положенных в основу того или иного словаря.
...Большую часть своей жизни в науке я занималась теоретической...
...В теоретических статьях к словарю обычно тщательно...
Может ли язык, используемый журналистами, повлиять на то, как будут восприниматься утверждения, вынесенные в заголовок новости? Очевидно, что может, поэтому заголовкам СМИ всегда уделяли много внимания. Оказалось, что для сообщений о научных фактах выбор слов тоже важен. Ученые давно знают? Ученые считают? Ученые уверены? Исследователи из Стэнфордского университета выяснили: выбор формулировки может существенно влиять на то, как читатель воспримет информацию: будет ли он ...
...Может ли язык, используемый журналистами, повлиять...
Не только в сельских школах, но и в городах-миллионниках не хватает учителей русского языка и литературы. На региональных филфаках сокращается число бюджетных мест и количество учебных часов на профильные предметы. «Российская газета» обсудила эту проблему с экспертами.
...Не только в сельских школах, но и в городах-миллионниках...
...В разговоре участвовали доктора филологических наук...
Национальный словарный фонд (НСФ) — федеральная государственная информационная система (ФГИС), предоставляющая совокупность информации о нормах современного русского литературного языка, закрепленных в нормативных словарях, а также в словарях, фиксирующих сведения о развитии норм русского литературного языка. Создание НСФ предусмотрено поправками в федеральный закон «О государственном языке Российской Федерации».
...Национальный словарный фонд (НСФ) — федеральная...
В эту подборку вошли в основном разного рода словари и энциклопедии для средней и старшей школы, изданные в последние 20 лет, и несколько книг для детей младшего школьного возраста, только начинающих задумываться об устройстве языка, на котором они говорят.
...В эту подборку вошли в основном разного рода словари...
...Книги о лингвистике могут помочь в освоении школьной...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Проблемы специфики существования русского языка в так называемой зоне интернета — это, безусловно, обширное белое даже не пятно, а просто-таки поле в современной русистике. Путешествуя по разным любопытным ссылкам, я узнала, что этот вопрос обсуждается довольно активно.
...Проблемы специфики существования русского языка в так...
...Так, на сайте «Редактор.ру» можно задать...
Исследователи Балтийского центра нейротехнологий и искусственного интеллекта БФУ им. Канта натренировали большую языковую модель на текстах трудов Иммануила Канта. В результате, по их словам, модель научилась поддерживать диалог о философских понятиях. Пресс-служба БФУ опубликовала несколько цитат из ответов бота. Например, вот как он отреагировал на вопрос, возможна ли ложь во спасение: «Дорогой друг, я считаю, что ложь не может быть использована во спасении. Ведь ложь противоречит ...
...Исследователи Балтийского центра нейротехнологий и...