Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Исследователи из Массачусетского технологического института...
...Опыты группы разработчиков из MIT показал, что NLEP...
...“, то есть неверные ответы, которые исходят из...
В 2023 году проект «Национальный корпус русского языка» активно развивался. Лингвисты и разработчики общими усилиями добавляли новые корпусы и сервисы, внедряли умную нейросетевую разметку, улучшали поиск и дизайн сайта. Одним из самых масштабных обновлений стало внедрение удобного и современного интерфейса (работа над ним заняла около двух лет). Подробно особенности нового интерфейса описаны в статье на сайте НКРЯ. В чем его преимущества? Интерфейс, адаптирующийся под ...
...Одним из самых масштабных обновлений стало внедрение...
...пользователь может получить доступ к поиску по любому из...
...Информация из корпусов может быть сложна для восприятия...
В языках, на которых говорят в промышленно развитых странах, обычно есть около дюжины основных терминов для обозначения цвета, тогда как в языках, на которых говорят более изолированные группы, их часто меньше (вернее, они распределены неравномерно: некоторые части цветового спектра могут почти не иметь соответствующих слов). Это связано с тем, что в жизни людей из этих групп просто нет объектов и ситуаций, которые требуют использования таких слов. Однако владение вторым языком может повлиять на ...
...Это связано с тем, что в жизни людей из этих групп...
...ntilde;us по-разному: некоторые используют только одно из...
...Малик-Мораледы, результаты исследования показывают «одно из...
Новый идеографический словарь должен стать дополнением к известному словарю избранных индоевропейских синонимов Карла Дарлинга Бака1, впервые изданному более семидесяти лет назад; вошедший в него материал славянских языков был представлен неполно и с неточностями. В словаре Бака представлены свыше тысячи значений (синонимических рядов) и лексика из разных индоевропейских языков. В новый словарь планируется включить гораздо больше значений. Будут приведены ...
...тысячи значений (синонимических рядов) и лексика из...
...Будут приведены соответствия из всех славянских языков...
...кашубский и вымерший полабский, а также из...
Чтобы понять, как люди пользуются языком, лингвисты не только наблюдают. В этой науке тоже есть место эксперименту. О том, какой путь проделала экспериментальная лингвистика и какие есть современные способы организовать и провести эксперимент, рассказывает статья в журнале «Системный Блокъ».
...Чтобы понять, как люди пользуются языком, лингвисты...
...проведенные впоследствии, не подтвердили многие тезисы из...
...Экспериментальные методы пришли в лингвистику из...
...На выбор одного из способов могут влиять, в частности...
Помимо основного списка для «Слова года», Грамота вводит четыре тематические номинации, для каждой из которых мы составили отдельный шорт-лист. Выбор претендентов опирался на частоту упоминаний слов в специализированных СМИ, которую мы определили с помощью нашего аналитического партнера — системы «СКАН-Интерфакс». «В основном „слове года“ мы в первую очередь искали слова, которые интересны с точки зрения русского языка.
...вводит четыре тематические номинации, для каждой из...
...Из сферы экономики и финансов в список включены...
...в чем специфика отобранных слов и какие из...
Весенний сезон 2023 года ведущие популярного подкаста посвятили истории русского языка. Научный руководитель Грамоты, научный сотрудник Института русского языка РАН Владимир Пахомов и журналист Александр Садиков размышляют о том, что во все времена люди спорили по-русски о порче языка, осуждали новомодные иностранные заимствования и ругали современные им словари.
...Весенний сезон 2023 года ведущие популярного подкаста...
...Сезон состоит из пяти выпусков, каждый из которых посвящен...
...Показательно, насколько быстро жаргонные слова уходят из...
Московская библиотека им. Н. А. Некрасова совместно с Грамотой организует цикл из четырех лекций «Слово за словом», посвященный 125-летию со дня рождения лексикографа Сергея Ожегова. Филологи расскажут о личности Ожегова, особенностях составления современных словарей, о том, как меняется наше представление о языке с точки зрения новых законов, норм, и о том, почему лингвисты нормализуют ударения, которые «режут слух».
...Некрасова совместно с Грамотой организует цикл из...
...и о некоторых вариантах нормы, которые из...
... нежелательных стали допустимыми, а из ...
С наличием в языке вариантов связано сразу несколько распространенных заблуждений. Считается, что в литературном языке не должно быть двух правильных вариантов одного и того же слова; наличие вариантов в словарях свидетельствует только о том, что лингвисты не могут договориться между собой; варианты в словарях — примета нашего времени, в изданиях прежних лет варианты не допускались. На самом деле вариантность — непременный атрибут литературного языка, а фиксация вариантов в словарях — неотъемлемая часть работы лингвистов-кодификаторов.
...С наличием в языке вариантов связано сразу несколько...
...Носитель языка вправе выбрать любой из них &mdash...
...новостях» писала: «Я заметила, что одним из...
...Одна из самых интересных стадий на этом пути &...
Разные словари необходимы для разных задач. Какими-то пользуются только специалисты, другие нужны тем, кто так или иначе работают с языком, — учителям, школьникам, студентам, редакторам, публицистам. Расскажем о пяти самых востребованных типах словарей для широкого круга пользователей: толковом, орфографическом, словаре ударений, двуязычном и словаре синонимов.
...Разные словари необходимы для разных задач. Какими-то...
...laquo;Лексис сиречь речения вкратце собранные и из...
...толкование старославянизмов и заимствований из...
...Многие из нас время от времени ищут на Грамоте такие...