Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Всем знакома картинка, на которой обезьяна поэтапно превращается в человека, в руках у которого на последней стадии эволюции появляется книга. Мы выбрали пять книг, которые посвящены влиянию чтения на людей, роли библиотек в современном цифровом мире, методам повышения продуктивности чтения и тому, как заинтересовать книгами детей.
...Всем знакома картинка, на которой обезьяна поэтапно...
...1. Юлия Щербинина. Время библиоскопов. Современность...
Изучение способов обозначения эмоций в разных языках может оказаться полезным при определении тональности текста. При этом понять, как слова языка распределяются по эмоциональному спектру, бывает непросто, нюансы семантических связей не всегда очевидны. Чтобы их прояснить, используются различные способы обработки больших лексических данных. Исследователи из Токийского университета науки и Сайтамского университета составили иерархию концептов, связанных с обозначением ...
...Изучение способов обозначения эмоций в разных...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Национальный корпус русского языка — это огромная...
Специалисты из Нью-Йоркского университета создали модель машинного обучения (нейросеть), которая анализирует электрическую активность коры головного мозга, связанную с речью, и воспроизводит задуманные человеком слова. Для обучения модели исследователи обратились к группе из пяти пациентов с диагностированной рефрактерной эпилепсией и нарушениями развития речи. В этом состоянии пациент не реагирует на лечение противоэпилептическими препаратами в адекватных дозах и комбинациях, то есть не ...
...Специалисты из Нью-Йоркского университета создали ...
Обычно дети за несколько лет легко переходят от лепета к построению сложных предложений, но это происходит не всегда равномерно. Специалисты уже исследовали связь между речевым развитием ребенка и его полом, а также социально-экономическим положением семьи. Например, в ряде прошлых работ было показано, что в обеспеченных семьях дети осваивают язык быстрее, чем в неблагополучных. Однако один из недостатков этих работ заключался в том, что они не охватывали повседневное использование языка ...
...Обычно дети за несколько лет легко переходят от лепета...
За двадцать лет Национальный корпус русского языка стал незаменимым инструментом лингвистических исследований. Однако создавался он не только для специалистов. О корпусах и их роли в развитии наших представлений о языке академик Владимир Плунгян и доктор филологических наук Андрей Кибрик говорили на заседании Президиума РАН, где обсуждались фундаментальные проблемы лингвистики и задачи корпусных исследований языков. Репортаж с заседания публикует газета «Поиск».
...За двадцать лет Национальный корпус русского языка...
...Первые корпусы появились в 1960-х годах, но тогда...
Новый идеографический словарь должен стать дополнением к известному словарю избранных индоевропейских синонимов Карла Дарлинга Бака1, впервые изданному более семидесяти лет назад; вошедший в него материал славянских языков был представлен неполно и с неточностями. В словаре Бака представлены свыше тысячи значений (синонимических рядов) и лексика из разных индоевропейских языков. В новый словарь планируется включить гораздо больше значений. Будут приведены ...
...Новый идеографический словарь должен стать дополнением...
Ответственный редактор монографии — академик Николай Николаевич Казанский, специалист по классической филологии и индоевропеистике. Книга рассчитана на широкий круг читателей, которые интересуются российской наукой и ее историей.
...Ответственный редактор монографии — академик...
...Институт лингвистических исследований имеет богатую...
Правительство РФ внесло в Госдуму законопроект о создании Национального словарного фонда — единого цифрового ресурса, содержащего данные словарей русского языка. Закон «О государственном языке РФ» предлагается дополнить статьей, которая будет регламентировать создание и работу Национального словарного фонда. Под ним понимается государственная информационная система, в которой будут представлены данные о нормах современного русского ...
...Правительство РФ внесло в Госдуму законопроект...