Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Нейросети учатся на текстах, созданных человеком. Но...
...Обучение и самообучение: как синтетические данные влияют...
...Грамота: Одна из страшилок, связанных с развитием...
По случаю Европейского дня языков, который отмечается 26 сентября, социологическая служба Евростат представила последние данные о предпочтениях школьников Евросоюза при выборе второго языка (помимо местного) в качестве обязательного для изучения. Самым популярным оказался английский — это касается и среднего общего, и среднего технического образования. Его выбрали 96,8% и 78,6% соответственно. Второе место в общеобразовательных школах занял испанский язык (26,8%), за ним следуют ...
...Евростат опубликовал данные о месте русского языка...
...По случаю Европейского дня языков, который отмечается...
Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Нейросеть выучилась понимать язык без использования...
...Большие языковые модели — нейросети, способные...
Нейросети обучаются на текстах, которые создали люди, и используют эти данные для генерации новых текстов. На первый взгляд бывает сложно отличить тексты, написанные машиной и человеком. Статья на «Хабре» рассказывает о признаках, методах и инструментах, которые помогают выявить текст, созданный нейросетью.
...Нейросети обучаются на текстах, которые создали люди...
...Как отличить текст, написанный нейросетью? Ряд критериев...
...В последнее время искусственный интеллект далеко...
Новый перевод классической книги сделан с издания 2007 года и поэтому отражает более актуальные научные данные по сравнению с изданием 1994 года. Научный соредактор книги Валерий Шульгинов, социолингвист, автор телеграм-канала «Лингвоед», рассказал по просьбе Грамоты о том, чем взгляд Пинкера на язык может быть интересен сегодняшним читателям.
...Новый перевод классической книги сделан с ...
...Вышло новое издание научно-популярной книги Стивена...
...«Язык как инстинкт» Стивена Пинкера, одна...
Портал In Science рассказал о базе данных, которую создала международная группа ученых. В этой базе задокументировано грамматическое разнообразие сотен языков мира.
...Портал In Science рассказал о базе данных, которую...
...Лингвисты показали грамматическое разнообразие языков...
...Общество научных исследований имени Макса Планка (Германия...
Сегодня миллионы книг могут быть доступны нам в три клика. Нынешнее поколение школьников и студентов выросло с гаджетами в руках и с детства привыкло читать с экранов, что не могло не заинтересовать исследователей. Собранные данные говорят о том, что изменение носителя информации влияет на понимание и усвоение прочитанного. Вопрос в том, как именно влияет.
...Сегодня миллионы книг могут быть доступны нам в ...
...Бумага или «цифра»? Влияние формата чтения на понимание...
...Чтение как неестественный процесс Многие исследования...
Ведущий канала «Основа» Борис Веденский обсудил с историком-медиевистом, переводчиком, доктором исторических наук Олегом Воскобойниковым отличия письменной культуры Руси от стран Западной Европы, процесс переписывания рукописей и издание древних текстов, а также выяснил, что пили в Средние века и были ли на Руси ведьмы.
...Ведущий канала «Основа» Борис Веденский...
...О чем мы можем узнать из средневековых рукописных текстов...
...Монгольское нашествие сильно ударило по всем сторонам...
Найти слово сразу в нескольких словарях, сравнить результаты, проверить свою версию написания, произношения или толкования — посетители Грамоты всегда охотно пользовались этой возможностью. Но в некоторых случаях детали не нужны, а требуется, наоборот, быстро получить самое общее представление о слове. Руководитель словарного направления Грамоты Анастасия Александровна Бонч-Осмоловская объясняет, каким образом в метасловаре объединены и структурированы данные о слове и какие преимущества новый формат дает пользователям.
...Найти слово сразу в нескольких словарях, сравнить результаты...
...В метасловаре пользователь сначала видит общую картину...
...Метасловарь как агрегатор Задать вопрос справочной...
Как изменилось наше представление о языке после появления корпусов текстов, в частности Национального корпуса русского языка? Использование корпуса в практике лингвистических исследований уже стало общепринятым, а что дают корпусные данные теоретикам? Какие явления следует изучать в первую очередь и почему лингвисты не должны опираться на интуицию? Об этом Грамота поговорила с академиком РАН, заместителем директора Института русского языка им. В. В. Виноградова Владимиром Александровичем Плунгяном.
...Как изменилось наше представление о языке после появления...
...Владимир Плунгян: «Первый урок корпуса — не злоупотреблять...
...Грамота: Все, кто работает с языком как исследователи...