Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Грамота: Одна из страшилок, связанных с развитием...
В русском языке, как известно, есть два способа образования сравнительной степени: с помощью суффиксов («холоднее», «веселей») и путем прибавления к форме положительной степени слова «более» («более холодный», «более веселый»). В отношении синтетической простой формы сравнительной степени типа «веселее» у языковедов споров не возникает: она признаётся морфологической (если, конечно, вообще категория степеней сравнения причисляется к морфологическим категориям). По поводу же образований типа «более холодный» в специальной литературе существуют две противоположные точки зрения.
...В русском языке, как известно, есть два способа...
... Виктор Владимирович Виноградов, например, писал...
В течение многих лет такие компании, как OpenAI и Google, собирали данные из интернета для обучения больших языковых моделей вроде ChatGPT. Эти модели в процессе обучения «переваривали» гигантские объемы текстов: публицистику, научные статьи, романы, инструкции, официальные документы, посты в соцсетях. Благодаря этой «пище» программы смогли сами генерировать нечто подобное. Но запасы созданных человеком письменных текстов иссякают. Исследовательская ...
...В течение многих лет такие компании, как OpenAI...
В разных контекстах Вильгельм фон Гумбольдт подчеркивал различные аспекты языка. Отсюда — его разные определения. В контексте же настоящей статьи для нас имеют главное значение два гумбольдтовских понимания языка — деятельностно-речевое («Язык есть деятельность») и системно-знаковое («Язык есть система знаков»). Из первого из них вытекает возможность проследить, в каком соотношении в учении Гумбольдта находятся семасиологизм и ономасиологизм, а из второго — в каком соотношении в нем представлены язык и речь.
...В разных контекстах Вильгельм фон Гумбольдт подчеркивал...
...В отличие от Фердинанда де Соссюра (1857&ndash...
В 2023 году специалисты в области нейросетевых вычислений Илья и Захар Шумайловы описали явление, которое они назвали «коллапс модели». Под коллапсом модели авторы понимают процесс «вырождения», затрагивающий несколько поколений генеративных моделей, в ходе которого сгенерированные данные снова и снова загрязняют ту выборку, на котором обучается следующее поколение моделей. В недавней статье, опубликованной в журнале Nature, они ...
...В 2023 году специалисты в области нейросетевых...
Предки русских, англичан, французов, иранцев, армян, таджиков, греков, части народов Индии и других народов много тысяч лет назад говорили на одном языке, который ученые называют праиндоевропейским. Так что русский язык — не только славянский, о чем всем известно; он также входит в большую и пеструю семью потомков праиндоевропейского языка. В чем проявляется это родство?
...Предки русских, англичан, французов, иранцев, армян...
...Индоевропейские языки и другие языковые семьи...
Нейросети уже неплохо справляются с анализом и порождением текстов, они умеют многое из того, что раньше делали только люди. Какие возможности это дает? Участники круглого стола «Ай да AI. Нейросети и создание текстов: проблемы и перспективы генеративных моделей» обсудили, чем ИИ может помочь в научной работе и какие навыки понадобятся людям в цифровую эпоху. Грамота записала самое главное.
...Нейросети уже неплохо справляются с анализом и...
...В дискуссии на Костомаровском форуме участвовали руководитель...
Почему навык чтения необходим для развития мозга? Какие этапы проходит ребенок, пока учится читать? Правда ли, что бумажные книги полезнее электронных? На эти и другие вопросы ответила физиолог, психолог, доктор биологических наук и академик Российской академии образования Марьяна Безруких, выступая на онлайн-конференции «Детское чтение как основа всестороннего развития личности, общества и государства».
...Почему навык чтения необходим для развития мозга? Какие...
...Почему дети перестают читать Многие современные дети...
Во время стрима «Лингвисты о лингвистках. Феминитивы в научном освещении» сотрудники Института языкознания РАН, ведущие подкаста «Глагольная группа» Игорь Исаев и Дмитрий Коломацкий обсудили явление, которое не уходит из новостной повестки и вызывает бесконечные споры. В обсуждении прозвучали экспертные мнения члена-корреспондента РАН Евгения Головко, доктора филологических наук Валерия Ефремова, блогера, преподавателя, автора книги «В начале было кофе» Светланы Гурьяновой, а в дополнительных материалах можно услышать научного сотрудника РГГУ Ирину Фуфаеву и научного сотрудника Института славяноведения РАН Глеба Пилипенко.
...Во время стрима «Лингвисты о лингвистках...
...Что такое феминитивы? С точки зрения лингвистической...
Овладеть каким-либо языком — значит приобрести определенный, максимально возможный словарный запас, усвоить грамматический строй изучаемого языка и научиться ими пользоваться в речевой практике. Все эти стороны в овладении языком одинаково важны, взаимосвязаны и взаимообусловлены.
...Овладеть каким-либо языком — значит приобрести...
...Одна из главных задач курса русского языка в нашей...