Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
Сегодня специалисты согласны в том, что сложные системы коммуникации есть не только у людей. Понимание того, как общаются животные, может дать представление об их социальных структурах и поведении и улучшить жизнь одомашненных видов. Прогресс в этом направлении обеспечивают нейросети, которые анализируют большие объемы информации и находят неочевидные закономерности. Исследователи из канадского Университета Далхаузи использовали методы обработки естественного языка ...
...Сегодня специалисты согласны в том, что сложные...
Для читателей, интересующихся историей языкознания, мы выбрали несколько книг, написанных отечественными учеными в последние десятилетия. Они дают представление о том, что такое лингвистика, как она связана с другими научными дисциплинами, чем научный подход к языку отличается от любительского и как исторические обстоятельства XX века влияли на судьбу научных идей и тех, кто их отстаивал.
...Для читателей, интересующихся историей языкознания,...
...1. Владимир Журавлев. Занимательные диалоги о языкознании...
НКРЯ — представительный корпус текстов на русском языке. В нем собраны тексты самых разных жанров — и примерно в той пропорции, в которой с ними сталкивается обычный носитель языка. Разработкой корпуса занимается большая команда лингвистов, а также опытные программисты, и он постоянно совершенствуется. Сейчас в нем больше шести миллионов текстов, в которых в сумме содержится более двух миллиардов слов, и постоянно ...
...НКРЯ — представительный корпус текстов на...
Представьте себе словарь, в котором значения слов зависят от возраста читающего, его культурного бэкграунда, политических взглядов и даже формата книги. Именно так обстоят дела с эмодзи — универсальными и одновременно субъективными пиктограммами, которыми каждый день пользуются миллионы людей во всем мире.
...Представьте себе словарь, в котором значения слов зависят...
...Этот материал — часть совместного...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем об изменениях, которые произошли за последний год. Появился новый способ представления информации о слове — «Портрет слова». Он позволяет узнать об определенном слове максимум подробностей: сочетаемость с другими словами, грамматические и ...
...Национальный корпус русского языка — это огромная...
Предлагаем вниманию читателей портала статью профессора Льва Владимировича Щербы, опубликованную в журнале «Русский язык в школе» (№ 5, 1936). Мысли о будущем языка, высказанные Л. В. Щербой восемьдесят лет назад, и сегодня не утратили актуальности.
...Предлагаем вниманию читателей портала статью профессора...
...Предисловие «Грамоты.ру» Лев Владимирович...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
В историях про Алису что ни эпизод — то задача: математическая, логическая или лингвистическая. Примеры таких скрытых задач приведены в журнале «Наука и жизнь».
...В историях про Алису что ни эпизод — то задача...
...Первый эпизод, который анализирует педагог Наталья...
Онлайн-словарь Лексикон — проект Грамоты, оперативно реагирующий на изменения в живой речи, — пополнился блоком лексики из сферы еды и кулинарии. Это слова, которые активно используются в ресторанной сфере и повседневном общении, но могут вызвать затруднения при письме, а их точный смысл не всегда понятен. Получили лексикографическое описание такие слова, как ...
...Онлайн-словарь Лексикон — проект Грамоты...