Список Сводеша: по каким словам можно судить о степени родства языков

Родству языков посвящена такая область лингвистики, как сравнительно-историческое языкознание, или компаративистика. Ученые сравнивают родственные языки между собой, прослеживают эволюцию, реконструируют общий праязык. Один из инструментов для оценки степени родства языков разработал американский лингвист Моррис Сводеш. Его так и называют — список Сводеша.
Жизнь и карьера Морриса Сводеша
Моррис Сводеш родился 22 января 1909 года в Массачусетсе (США) в еврейской семье, которая эмигрировала из Российской империи. Он с детства владел идишем, английским и немного — русским языком. Сводеш учился в Чикагском университете, а его научным руководителем был Эдвард Сепир — один из крупнейших американских лингвистов XX века. Сводеша вдохновили списки слов, составленные Сепиром, которые доказывали сходство разных индейских языков. В 1933 году молодой ученый получил степень доктора философии; его диссертация была посвящена языкам коренных народов Северной Америки. Сводеш проводил полевые исследования языков индейцев в Канаде, США и Мексике. Его интересовали вопросы языковой эволюции и сравнительно-исторического анализа, классификация языков.
Сводеш верил, что когда-нибудь науке удастся установить родственные связи между всеми языками мира и реконструировать единый праязык человечества.
Во время Второй мировой войны он как лингвист участвовал в военных проектах: составлял справочные материалы на бирманском, китайском, русском и испанском языках, а также написал упрощенные учебники русского и китайского для военнослужащих. После окончания войны Сводеш преподавал в Городском колледже Нью-Йорка, но в 1949 году был уволен из-за членства в Коммунистической партии, после чего продолжил работать в университетах Мексики и Канады.
Моррис Сводеш скончался 20 июля 1967 года, оставив после себя значительное наследие в области исторической лингвистики.
Глоттохронология: новый метод сравнения языков
В основе сравнительно-исторического языкознания лежит идея распада первоначального языкового единства — монолитного языка или, что вероятнее, группы близкородственных диалектов, носители которых могли легко понимать друг друга. Сравнительно-исторический метод начал формироваться еще в XIX веке, большой вклад в его разработку внесли такие ученые, как Расмус Раск (1787–1832), Франц Бопп (1791–1867), Якоб Гримм (1785–1863), Александр Христофорович Востоков (1781–1864).
Сравнительно-исторический метод был сформирован на материале языков индоевропейской семьи. К ней относятся в том числе древние языки, которые сильно отличались друг от друга уже несколько тысячелетий назад, — например, латинский, древнегреческий, санскрит и древнеперсидский. Эти языки имеют долгую письменную историю и большое количество сохранившихся текстов, но для значительной части других языковых семей давняя письменная фиксация отсутствует. А большинство языков индейцев, которые исследовал Сводеш, и вовсе бесписьменны, поэтому традиционные подходы по отношению к ним малоприменимы.
В 1950-е годы Сводеш в нескольких статьях представил свой метод для оценки времени расхождения родственных языков на основе анализа их базисной лексики, который называется глоттохронология (от др.-греч. γλῶττα ‘язык’ + хронология).
Согласно этому методу, в большей степени родственными следует считать те языки, между списками базисной (основной) лексики которых обнаружено больше совпадений.
Иногда в качестве синонима к глоттохронологии используют термин лексикостатистика, который имеет и более узкий смысл — подсчет слов, имеющих общее происхождение в родственных языках, и сравнение наиболее устойчивой части их лексического фонда (не затрагивая вопрос времени распада праязыка).
Метод глоттохронологии построен по аналогии с радиоуглеродным методом измерения возраста органических веществ. Для вычисления времени расхождения языков Сводеш предлагал использовать специальную формулу с натуральными логарифмами:
t — период времени от одной стадии языка к другой (в тысячелетиях),
c — процент сохранившихся к концу этого периода единиц из списка,
r — скорость замены для этого списка слов.
По подсчетам Сводеша, скорость замены одних единиц другими в стословном списке составляет около 14 слов в тысячелетие. Таким образом, за 1000 лет языки в среднем сохраняют около 85% основного словника1.
Стословный список
Какой стословный список имеется в виду? Он получил известность в лингвистическом сообществе как список Сводеша (англ. Swadesh list). Это набор базисных слов для сравнения языков и выявления степени их родства. Первая версия списка содержала 215 слов. В дальнейшем ученый планировал расширить список, чтобы добиться большей статистической точности, но в итоге решил сократить его, придя к выводу, что качество не менее важно, чем количество.
Наиболее известные версии содержат 100 и 200 слов. Перечень лексем упорядочен по степени их «базисности».
Сводеш исходил из того, что в каждом языке есть некоторое устойчивое подмножество слов — базисная лексика, которая если и вытесняется со временем, то происходит это крайне редко.
К базисной лексике принято относить основные местоимения, числительные, термины родства, части тела, названия наиболее элементарных и универсальных явлений природы, природных объектов и др. Такие слова не связаны с какой-то конкретной культурой и особенностями местной жизни, поэтому они редко заимствуются из других языков: я, ты, он, этот, голова, рука, глаз, один, два, три, мужчина, женщина, большой, маленький, есть, пить, стоять, сидеть, вода, огонь, рыба и т. п.
Скорость изменений в этом основном списке, по мнению Сводеша, постоянна и не зависит от выбранного языка и временного периода. Кроме того, Сводеш считал, что стабильность всех элементов списка постоянна (все лексемы одинаково устойчивы к изменениям), а замены в списках языков-потомков после их разделения происходят независимо2.
Критика и развитие метода
Многие лингвисты указывали на недостатки предложенной модели. Во-первых, данные, полученные при помощи глоттохронологии, часто плохо соотносятся с историческими свидетельствами для хорошо задокументированных языков — метод Сводеша значительно занижает время их расхождения (приближает момент расхождения к нашему времени). Например, согласно модели Сводеша разделение румынского и арумынского с долей совпадения 89% должно было произойти около 370 лет назад, то есть примерно в XVII веке, в то время как по другим данным оно произошло еще в IX веке (арумыны упоминаются как отдельный этнос в византийской хронике)3.
«Лингвистические датировки, полученные с использованием глоттохронологических методов, имеют вероятностный характер и представляют собой не точную величину, а диапазон (доверительный интервал) значений, к которому с известной вероятностью будет принадлежать искомая дата»4, — отмечают лингвисты Михаил Васильев и Михаил Саенко.
Они предлагают повысить надежность датировок за счет привлечения дополнительных данных из различных языковых групп и семей.
Саенко также критикует тезис Сводеша о том, что языки тем более родственны, чем больше у них совпадают списки: «Слабая сторона такого подхода в том, что большее количество совпадений, например, между языками A и B по сравнению с языком C может являться следствием инноваций в языке C, отсутствующих в языках A и B»5.
У глоттохронологии есть и другие проблемы. В частности, сильные фонетические преобразования могут помешать идентифицировать родственные слова. А если у базовых понятий в языке есть синонимы, то не вполне понятно, какое именно слово включить в список для последующего сопоставления; в некоторых языках отдельные элементы базисного словаря и вовсе отсутствуют. Данные исландского языка и литературного норвежского (риксмола) за последнее тысячелетие показывают, что родственные языки могут меняться с разной скоростью, причем темп изменений в отдельном языке тоже меняется от одной эпохи к другой.
Знаменитый компаративист Сергей Старостин предложил улучшенный вариант формулы дивергенции (расхождения) языков.
Он обратил внимание на то, что из списка базисной лексики следует исключить все заимствованные слова, так как они появились не в результате внутреннего развития языка, а из-за внешних контактов. Старостин отмечал, что слова в базисном лексиконе со временем устаревают, и чем больше промежуток времени, который мы рассматриваем, тем больше вероятность замены слова. Неодинакова и стабильность слов в списке: с течением времени доля более устойчивых значений увеличивается, а наименее устойчивые могут повторно заменяться6.
Наглядное пособие для работы с лексикой
Несмотря на все отмеченные лингвистами недостатки, список Сводеша остается удобным инструментом сравнения языков. Ученые используют разные списки, в том числе создают свои собственные — например, ленинградский китаист Сергей Яхонтов пользовался списком из 35 слов. Чем меньше список, тем более устойчивой должна быть в нем лексика.
Список Сводеша помогает эффективнее изучать иностранные языки, позволяя выбрать для запоминания наиболее частотную лексику.
Декан факультета гуманитарных и социальных наук Университета королевы Виктории в Веллингтоне (Новая Зеландия) Аверил Коксхэд создала «Список Сводеша 2.0» — схему The Academic Word List из нескольких сотен словарных групп, которая должна помочь в учебе и работе. Слова, как и в списке Сводеша, расположены в порядке убывания частотности. Корпус, на основе которого сделана схема, содержит выдержки из разных научных текстов, но Аверил исключила все сложные термины.
Список содержит 94% лексики, которая встречается в 20 из 28 научных дисциплин, которые исследовательница выделила как основные.
Список Сводеша полезен еще и тем, что помогает далеким от языкознания людям понять смысл термина «исконно русская (или исконно английская, исконно арабская) лексика». Иногда сходство слов вода и англ. water или мать, матерь и нем. Mutter заставляет подозревать тут заимствование. На самом деле, если речь идет о базисной лексике из списка Сводеша, это сходство говорит о происхождении из общего корня в общем праязыке, то есть оба слова являются исконными для соответствующих языков.
Еще на
эту тему
Лингвист Светлана Бурлак — о происхождении языка, истории языковых семей и их будущем
Большой разговор на канале «Основа»
Русский как индоевропейский: общие корни заметны даже у дальних родственников
На что обращают внимание лингвисты, когда сравнивают языки и выясняют их историю
«Сравнительный словарь всех языков и наречий» Палласа стал доступен в цифровом виде
Речь идет об уникальном многоязычном словаре, составленном в XVIII веке Петром Палласом