Большие языковые модели — нейросети, способные порождать тексты на естественном языке, — обычно обучаются на текстах. Ключевое отличие обучения таких программ от обучения людей заключается в том, что люди овладевают языком, не прибегая к использованию таких колоссальных объемов однородных данных. При этом программы еще и допускают нелепые (с нашей точки зрения) ошибки. Один из альтернативных подходов — позволить машинам учиться так, как учатся ...
...Большие языковые модели — нейросети, способные...
В новый номер периодического издания «Труды Института русского языка им. В. В. Виноградова» вошла статья, посвященная диахронному описанию причинного союза «ибо» и целевого союза «дабы». Несмотря на то что эти союзы помечаются в словарях как книжные, их можно встретить и в современной разговорной речи — в том числе в сниженном стиле.
...В новый номер периодического издания «Труды Института...
...Союз ибо заимствован из еще старославянского языка,...
Чтобы понять, как люди пользуются языком, лингвисты не только наблюдают. В этой науке тоже есть место эксперименту. О том, какой путь проделала экспериментальная лингвистика и какие есть современные способы организовать и провести эксперимент, рассказывает статья в журнале «Системный Блокъ».
...Чтобы понять, как люди пользуются языком, лингвисты...
...Когда-то лингвисты-теоретики основывали свои суждения...
Нивхский — один из малых языков России, на котором почти перестали разговаривать его носители. О том, как нейросети и голосовые помощники помогают сохранить нивхский, а в перспективе могут улучшить ситуацию и с другими языками малочисленных народов, в интервью изданию «Научная Россия» рассказал руководитель лаборатории, доктор филологических наук Павел Гращенков.
...Нивхский — один из малых языков России,...
...Павел Гращенков руководит Лабораторией автоматизированных...
Лингвистика не существует в вакууме и активно взаимодействует с другими науками. Чем занимается социолингвистика и антропологическая лингвистика? Почему важно документировать языки народов России? Об этом ведущие подкаста «Глагольная группа» лингвисты Дмитрий Коломацкий и Игорь Исаев поговорили с членом-корреспондентом РАН Евгением Головко — специалистом в области алеутского языка, социолингвистики и языковых контактов.
...Лингвистика не существует в вакууме и активно...
...Языками интересуются разные науки Евгений Головко...
Практически всем приходится время от времени заниматься заполнением документов, будь то трудовой договор, претензия к производителю товара или заявление о замене счетчиков воды. Такие тексты написаны в специфическом узнаваемом стиле, который называется официально-деловым. Каковы особенности этого стиля и почему он склонен к экспансии?
...Практически всем приходится время от времени заниматься...
...Из истории отечественного делопроизводства Традиция...
Ученый совет Института русского языка РАН утвердил к печати 30-й том «Этимологического словаря славянских языков» под редакцией академика О. Н. Трубачева, который реконструирует праславянский лексический фонд.
...Ученый совет Института русского языка РАН утвердил...
...Словарь, построенный на устных и письменных данных...
Борьба с иностранными заимствованиями в русском языке — не первый случай отторжения чужого. В истории есть много примеров, когда власти ставили масштабные эксперименты над языком в попытке уберечь его от внешних угроз, очистить, сохранить его самобытность и красоту. Такая политика носит название лингвистического пуризма.
...Борьба с иностранными заимствованиями в русском...
...Исландия: язык как историческое наследие В XIX...
Как лексиколога и лексикографа меня прежде всего занимают задачи эффективного лексикографического конструирования. Мы несколько лет работаем над масштабным проектом под названием «Русский тематический словарь». Любому филологу известно, что тематический словарь, в отличие от алфавитного, группирует лексику по смысловым блокам. Однако, помимо этого довольно понятного качества, он имеет еще одну важную жанровую особенность — ориентацию на продукцию речи (говорение и письмо).
...Как лексиколога и лексикографа меня прежде всего занимают...
...В лексикографии такие словари называют активными. Тематический...
Большие языковые модели — подобные тем, что используются в чат-ботах ChatGPT и других — могут писать рассказы, создавать контент-планы для соцсетей и даже шаблоны юридических документов. И все это — по запросу пользователя на обычном (естественном) языке. Но с операциями, требующими вычислений, модели справляются куда хуже. Почему? Дело в том, что языковая модель обучена на текстовых данных, которые для нее — просто данные.
...Большие языковые модели — подобные тем,...