Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Причем данные не были предварительно размечены ...
Тексты учебников должны не только соответствовать программе, но и быть доступными, разнообразными по жанрам и стилям, насыщенными актуальной лексикой. Можно ли объективно оценить такие сложные характеристики? Специалисты из Института Пушкина Антонина Лапошина и Мария Лебедева применили количественные методы к анализу учебников русского языка для начальной школы.
...Тексты учебников должны не только соответствовать программе...
...которые принимают методисты, должны опираться на данные...
Более половины участников ЕГЭ-2025 по русскому языку не смогли решить задание на правописание ни и не. Об этом пишет ТАСС со ссылкой на данные Федерального института педагогических измерений (ФИПИ). Трудности возникали с выбором правильного написания (не)даром, гласными и и ы после приставок, с использованием разделительных твердого и мягкого знаков. Со слитным, дефисным и раздельным написанием слов разных частей речи справились только 40% выпускников. Сильное ...
...Об этом пишет ТАСС со ссылкой на данные Федерального...
В последние годы благодаря развитию технологий нам удается узнать больше о коммуникации живых существ — от обезьян до птиц. В новом исследовании специалисты разобрались в том, как общаются между собой рыбы — красные груперы из семейства каменных окуней. Многие виды рыб используют звуки, но связать конкретный сигнал с определенным социальным поведением раньше было трудно. В новой работе научная группа из США и Пуэрто-Рико ...
...технологии FADAR мы смогли обработать акустические данные...
Пять книг, которые мы выбрали, предназначены для широкого круга читателей. Они свидетельствуют об интересе к происхождению русского письма, который сохранялся на протяжении всего XX века. Из них вы узнаете, как возникли привычные нам буквы, чем кириллица отличается от глаголицы и при чем здесь греки и финикийцы.
...Пять книг, которые мы выбрали, предназначены для широкого...
...псевдонаучных спекуляций: Истрин критически рассмотрел все данные...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...текстовых данных, которые для нее — просто данные...
Лингвистика не существует в вакууме и активно взаимодействует с другими науками. Чем занимается социолингвистика и антропологическая лингвистика? Почему важно документировать языки народов России? Об этом ведущие подкаста «Глагольная группа» лингвисты Дмитрий Коломацкий и Игорь Исаев поговорили с членом-корреспондентом РАН Евгением Головко — специалистом в области алеутского языка, социолингвистики и языковых контактов.
...Лингвистика не существует в вакууме и активно...
...но это не очень надежный инструмент — данные...
Команда ученых из Италии, США и Швейцарии проверила, насколько хорошо большим языковым моделям удается убеждать собеседников в своей правоте. Авторы привлекли к участию 900 жителей США. Каждому из них случайным образом выдали собеседника (это мог быть другой участник или чат GPT-4), тему и задачу — защищать или оспаривать предложенный тезис. Также в одном из вариантов участнику (человеку или чат-боту) была заранее доступна информация о
...под человека, используя его социодемографические данные...
«Мировое языковое разнообразие крайне велико и, насколько я могу судить по своему опыту, большинством людей недооценивается», — утверждает Калеб Эверетт во введении к книге «Мириады языков». С его точки зрения, существование языковых универсалий вызывает сомнения, а представление о естественном языке слишком сильно перекошено в сторону хорошо знакомых нам европейских языков. Чем интересна эта книга и почему ее стоит прочитать? Рассказывает социолингвист и научный редактор книги Валерий Шульгинов.
...«Мировое языковое разнообразие крайне велико...
...позволяет читателю самостоятельно оценить представленные данные...
Родству языков посвящена такая область лингвистики, как сравнительно-историческое языкознание, или компаративистика. Ученые сравнивают родственные языки между собой, прослеживают эволюцию, реконструируют общий праязык. Один из инструментов для оценки степени родства языков разработал американский лингвист Моррис Сводеш. Его так и называют — список Сводеша.
...Родству языков посвящена такая область лингвистики,...
...Во-первых, данные, полученные при помощи глоттохронологии...
... Данные исландского языка и литературного...