Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...
Русский язык не ограничивается литературным вариантом. В русских деревнях можно услышать разные диалекты, которые сохранили древние черты. В двух выпусках подкаста (1, 2) «Глагольная группа», а также в интервью журналу «Системный Блокъ» лингвист-диалектолог, заместитель директора Института языкознания РАН Игорь Исаев рассказал о своем опыте участия в диалектологических экспедициях.
...Русский язык не ограничивается литературным вариантом...
...Родители Игоря Исаева говорили на разных диалектах:...
Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Недавнее исследование, проведенное учеными из ...
Идея панславизма захватила умы в XIX веке на волне национальных движений. Но мысль о необходимости преодолеть религиозное и языковое разобщение славян зародилась гораздо раньше. Еще в XVII веке хорватский богослов, философ, лингвист и историк Юрий Крижанич попытался создать единый славянский язык.
...Идея панславизма захватила умы в XIX веке на ...
...Славянский полиглот Юрий Крижанич родился в 1618...
Перед вами третье задание конкурса, в котором есть задачки попроще и посложнее.
...Перед вами третье задание конкурса, в котором есть...
...Задания попроще 1. Буквомешалки Смешав и переставив...
Специалисты из Кембриджа разгадали загадку средневековой рукописи, которая более 130 лет ставила в тупик исследователей. Открытие не только помогло разрешить противоречие в знаменитых «Кентерберийских рассказах», но и показало, как средневековые священники уже в XII веке использовали популярную культуру — то, что современные исследователи называют мемами — для связи с паствой. В центре исследования оказалась проповедь ...
...Специалисты из Кембриджа разгадали загадку средневековой...
Представьте: вы договорились встретиться с другом на площади, но когда пришли — она оказалась переполненной. Все говорят, смеются, к тому же из динамиков гремит музыка. Вдруг вы замечаете в толпе друга. Как позвать его? Голос утонет в шуме. А теперь представьте, что вы заранее договорились хлопать в ладоши (или свистеть) в определенном ритме, чтобы сообщить о себе. Громкие ритмичные звуки будут выделяться на
...Представьте: вы договорились встретиться с ...
На презентации издания, которая состоялась 5 апреля на книжной ярмарке NonFiction, выступили историк, доктор исторических наук, профессор кафедры истории России до XIX века исторического факультета МГУ им. М. В. Ломоносова Антон Горский и лингвист, доктор филологических наук, ведущий научный сотрудник отдела языков народов Азии и Африки Института востоковедения РАН Светлана Бурлак.
...На презентации издания, которая состоялась 5 апреля...
...Антон Горский рассказал об истории сомнений в ...
В марте справочная служба ответила на десятки вопросов о запятых, мы их внимательно изучили, но так и не смогли выбрать самый интересный. Зато мы хотим поговорить о том, откуда в сервизе появилась лишняя посуда, почему у однокоренных слов корни бывают разной длины и как наши привычные жесты можно описать с помощью языка.
...В марте справочная служба ответила на десятки...
...Состав слова Вопрос: Помогите понять, почему в ...