Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В русском языке, как известно, есть два способа образования сравнительной степени: с помощью суффиксов («холоднее», «веселей») и путем прибавления к форме положительной степени слова «более» («более холодный», «более веселый»). В отношении синтетической простой формы сравнительной степени типа «веселее» у языковедов споров не возникает: она признаётся морфологической (если, конечно, вообще категория степеней сравнения причисляется к морфологическим категориям). По поводу же образований типа «более холодный» в специальной литературе существуют две противоположные точки зрения.
...В русском языке, как известно, есть два способа...
... Виктор Владимирович Виноградов, например, писал...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
В разных контекстах Вильгельм фон Гумбольдт подчеркивал различные аспекты языка. Отсюда — его разные определения. В контексте же настоящей статьи для нас имеют главное значение два гумбольдтовских понимания языка — деятельностно-речевое («Язык есть деятельность») и системно-знаковое («Язык есть система знаков»). Из первого из них вытекает возможность проследить, в каком соотношении в учении Гумбольдта находятся семасиологизм и ономасиологизм, а из второго — в каком соотношении в нем представлены язык и речь.
...В разных контекстах Вильгельм фон Гумбольдт подчеркивал...
...В отличие от Фердинанда де Соссюра (1857&ndash...
Нейросети уже неплохо справляются с анализом и порождением текстов, они умеют многое из того, что раньше делали только люди. Какие возможности это дает? Участники круглого стола «Ай да AI. Нейросети и создание текстов: проблемы и перспективы генеративных моделей» обсудили, чем ИИ может помочь в научной работе и какие навыки понадобятся людям в цифровую эпоху. Грамота записала самое главное.
...Нейросети уже неплохо справляются с анализом и...
...В дискуссии на Костомаровском форуме участвовали руководитель...
Ведущий и главный редактор портала «Грамота.ру» Владимир Пахомов углубляются в историю географических названий, которые приходят к нам из других языков и на примере названия американского штата Флорида показывают влияние традиций произношения, которые иногда превосходят по стойкости границы государств.
...Ведущий и главный редактор портала «Грамота.ру» Владимир...
Научный руководитель Грамоты, председатель Филологического совета Тотального диктанта Владимир Пахомов рассказал изданию Lenta.ru, почему не состоялась реформа русской орфографии 1964 года и стоит ли ожидать кардинальных изменений правил правописания в ближайшем будущем.
...Научный руководитель Грамоты, председатель Филологического...
...В 1960-е годы в реформе русской орфографии...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Предки русских, англичан, французов, иранцев, армян, таджиков, греков, части народов Индии и других народов много тысяч лет назад говорили на одном языке, который ученые называют праиндоевропейским. Так что русский язык — не только славянский, о чем всем известно; он также входит в большую и пеструю семью потомков праиндоевропейского языка. В чем проявляется это родство?
...Предки русских, англичан, французов, иранцев, армян...
...Индоевропейские языки и другие языковые семьи...
Почему навык чтения необходим для развития мозга? Какие этапы проходит ребенок, пока учится читать? Правда ли, что бумажные книги полезнее электронных? На эти и другие вопросы ответила физиолог, психолог, доктор биологических наук и академик Российской академии образования Марьяна Безруких, выступая на онлайн-конференции «Детское чтение как основа всестороннего развития личности, общества и государства».
...Почему навык чтения необходим для развития мозга? Какие...
...Почему дети перестают читать Многие современные дети...