Нивхский — один из малых языков России, на котором почти перестали разговаривать его носители. О том, как нейросети и голосовые помощники помогают сохранить нивхский, а в перспективе могут улучшить ситуацию и с другими языками малочисленных народов, в интервью изданию «Научная Россия» рассказал руководитель лаборатории, доктор филологических наук Павел Гращенков.
...Нивхский — один из малых языков России,...
...Павел Гращенков руководит Лабораторией автоматизированных...
Лингвистика не существует в вакууме и активно взаимодействует с другими науками. Чем занимается социолингвистика и антропологическая лингвистика? Почему важно документировать языки народов России? Об этом ведущие подкаста «Глагольная группа» лингвисты Дмитрий Коломацкий и Игорь Исаев поговорили с членом-корреспондентом РАН Евгением Головко — специалистом в области алеутского языка, социолингвистики и языковых контактов.
...Лингвистика не существует в вакууме и активно...
...Языками интересуются разные науки Евгений Головко...
Новые междометия появляются в языке гораздо реже, чем существительные и даже глаголы. И вообще в нашем языке их не так уж много. Как появилось новое выразительное слово пупупу и что именно оно выражает?
...Новые междометия появляются в языке гораздо реже...
...Что это значит Междометие пупупу выражает задумчивость...
Векторное представление слова в компьютерной лингвистике — это сопоставление слову из некоторого словаря числового вектора фиксированной длины, который отражает совместную встречаемость слова с другими словами в корпусе текстов. Каким образом такая модель передает важные семантические признаки слова? Какие у нее есть преимущества и ограничения? Грамота решила подступиться к этой теме с помощью компьютерного лингвиста Бориса Орехова.
...Векторное представление слова в компьютерной лингвистике...
...Слово и его окружение Идея представления слова...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...
Мы выбрали несколько программ, которые вышли в конце 2023-го и в начале 2024 года. Передача выходит один раз в неделю, все выпуски можно посмотреть на канале.
...Мы выбрали несколько программ, которые вышли в конце...
...Грамота. Накануне перезапуска обновленной Грамоты ведущая...
Русский язык не ограничивается литературным вариантом. В русских деревнях можно услышать разные диалекты, которые сохранили древние черты. В двух выпусках подкаста (1, 2) «Глагольная группа», а также в интервью журналу «Системный Блокъ» лингвист-диалектолог, заместитель директора Института языкознания РАН Игорь Исаев рассказал о своем опыте участия в диалектологических экспедициях.
...Русский язык не ограничивается литературным вариантом...
...Родители Игоря Исаева говорили на разных диалектах:...
В книге «История библиотек: от глиняных табличек до медиапространств» детский писатель Мария Коноплястая рассказывает об эволюции книжных собраний с древности до наших дней и показывает, почему библиотеки до сих пор остаются «аптеками для души» и «храмами литературы».
...В книге «История библиотек: от глиняных табличек...
...С появлением письменности люди начали использовать...
Недавнее исследование, проведенное учеными из Microsoft и ведущих американских университетов, опровергает идею, что нейросети всегда лучше работают с теми языками, для которых есть большие массивы текстов. При генерации или переводе текстов действует общее правило: чем больше данных для обработки доступно модели на этапе обучения, тем лучше будет результат. Например, ИИ-перевод на языки вроде английского и русского получается точнее, чем на менее распространенные —
...Недавнее исследование, проведенное учеными из ...