НЕКОТОРЫЕ ЗАМЕЧАНИЯ ПО ПОВОДУ ПРИМЕНИМОСТИ ГЛОТТОХРОНОЛОГИИ
Я не буду трогать основополагающие работы Старостина, а возьму одну из последних, статей которая мне очень понравилась. Действительно, красивая работа: М.Е.Васильев, А.Ю.Милитарев. "Глоттохронология в сравнительно-историческом языкознании. Модели дивергенции языков". Тем более, что основные достижения Старостина в ней изложены и от них эта статья и отталкивается.
Проблемы экспоненты
В основе глоттохронологии, как задумал ее Старостин, лежит экспонента. Экспонента - это конечно хорошая и вместе с тем предельно простая физическая зависимость, главным достоинством которой является эффект отсутствия последействия. Здесь все понятно.
Но почему слова в списке Сводеша должны выпадать с одинаковой скоростью? Очевидно, что это не так. При переселении народа или смене технологии (переход с охоты и рыболовства к земледелию) слова, обслуживающие разные сферы жизни популяции должны меняться с разной скоростью. Более того, при интенсивных контактах (взаимный этногенез) также из-за различия в способе хозяйствования, да и просто различия в фонетике и синтаксисе конкурирующих языков происходит аналогичное неравномерное исчезновение слов. Замечу, что возражение, что локальные неравномерности развития могут хорошо аппроксимироваться той же экспонентой с несколько "подправленным" коэффициентом здесь не проходит.
Мне лично ближе модель не простой экспоненты, а квадратичной, поскольку слова, связанные с характером трудовой деятельности, окружающим миром могут меняться быстрее, а какой-то базовый набор, связанный с сами человеком - очень медленно, если вообще меняется на интервале эдак тысячи три годков. Авторы статьи тоже получили результат, что есть некая группа слов, которая составляет слабо изменяющееся ядро. Но разве это и так кому то неясно? Я бы еще приветствовал этот вывод, если бы он для каждого языка показал, какие именно слова в списке Сводеша относятся к этому слабо изменяемому ядру, но глоттохронология этого, увы, не может.
Проблема суммы экспонент
Сумма экспонент вместо единственной экспоненты Старостина - это красиво, но по сути ничего не улучшает. Как есть сомнения в первоначальной экспоненте, так это есть и в использовании суммы экспонент. Типа, увеличим размерность пространства и разложим функцию по более обширному базису? Повторяю, нет никаких серьезных ФИЗИЧЕСКИХ доказательств правильности простой экспоненциальной зависимости в данной задаче.
Мысль авторов статьи вполне понятна: чем больше параметров, тем точнее мы сможем подогнать модель по реальность. Логично? Вроде бы, да. Но возникает проблема - а как калибровать все эти параметры? Ведь чем больше их количество, тем труднее решение задачи калибровки. Одним словом, увеличение размерности модели, чтобы решить проблему плохой аппроксимации вызывает новую проблему качественной калибровки непонятно каких параметров. То, как решена задача, напоминает проведение интерполирующего полинома через несколько точек, при этом тупой выбор степени полинома осуществляется так, чтобы он точно прошел через все точки и дал ТОЧНУЮ аппроксимацию. Но ведь такой путь только создает видимость решения задачи! Ниоткуда не следует, скажем, полиномиальная зависимость. Тем не менее, нащупали очевидный вывод о слабо изменяемом ядре. Но если бы сразу вместо простейшей экспоненты была использована более сложная базовая функция, учитывающая неравномерность скорости распада во времени, то и этой сложно совокупности экспонент и строить было бы не надо.
Проблема базовых констант
Базовые константы в таблице 1 вычислены на основе первоначальных исторических датировок и независимыми признаны быть не могут. Точно также константы в таблице 3 получены путем калибровок по текстам, датировки которых НАОБОРОТ должны быть получены на основе глоттохронологии. Другое дело, если глоттохронологи ВЕРЯТ историческим датировкам (а это тот самый случай). А я, простите, не верю таким датировкам! Будьте мне любезны ДОКАЗАТЬ правильность датировок этих самых текстов с помощью глоттохронологии.
Замечу, что в ДНК-генеалогии проблема легче. Все-таки скорости мутаций (базовое понятие, позволяющее действительно проводить независимые датировки) вычисляются «изнутри», поскольку опираются только на результаты ДНК-анализов (по парам «отец-сын»). Что-то такое же должно было быть и в глоттохронологии. Я понимаю, что использовать для этого тексты не ранее XV века (то есть, действительно достоверно датируемые) - это взять слишком малый интервал времени, результаты по которому, пролонгированные в прошлое на пару тысяч, дадут откровенную чушь. Но не я предложил такую науку как глоттохронология, и не мне отвечать за ее проблемы! Ниоткуда не следует, что глоттохронология в таком виде не является красивым, но недееспособным ребенком.
Данные, приведенные в таблице 5, это относительные оценки между современными языками, и в этой таблице нет абсолютных значений. Как только начинается обсуждение результатов таблицы 5, то сразу же в дело вступают ИСТОРИЧЕСКИЕ датировки в качестве опорных.
Опять-таки, калибровки по японским диалектам (таблица 6) отнюдь не могут быть так просто переносимы, скажем, на Европу (также напомним, что датировки опять опираются на исторические датировки VI веком н.э., т.е., на весьма слабо достоверные). Я не думаю, что базовая фонетическая система языка не влияет на скорость "распада" языка. Интуитивно ясно, что это не так, и поэтому по японским данным делать выводы для Европы как-то боязно.
Проблема базового списка Сводеша
Ну, про список, который используется для расчетов, вообще отдельная песня. Но об этом – потом, поскольку и так много написано.
Выводы в статье
Рассмотрим выводы, поскольку в них концентрируется то главное, что было достигнуто. Итак.
Вывод 1. Построение математической модели глоттохронологического процесса распада следует осуществлять путём определения её параметров по имеющейся совокупности опорных данных, которые состоят из установленных или достаточно очевидных исторических датировок и известных процентных совпадений ОС языков.
В том то и беда, что очевидными можно считать документы с возрастом не более 500 лет. А про процентные совпадения из ограниченного и непонятно как сформированного списка – отдельная песня.
Вывод 2. При использовании исходных данных следует учитывать их статистическую погрешность, которая определяет в итоге погрешность получаемых результатов модели.
Именно так. Погрешность определения коэффициентов модели по непонятно как датированным историками документам полностью перекачивается в модель, мало того, сама аппроксимация суммой экспонент вносит погрешность.
Вывод 3. В результате критического анализа третьего и четвёртого постулатов М. Сводеша обосновывается возможность построения глоттохронологической модели общего распада языка в виде суммы нескольких слагаемых, соответствующих группам значений ОС с различной интенсивностью распада
О спорности аппроксимации суммой экспонент я уже говорил.
Вывод 4. В четвертом выводе просто даны новые уравнения глоттохронологии.
Вывод 5. Значения параметров моделей могут изменяться в зависимости от исходных данных, используемых при расчёте. Однако главным итогом работы представляются не значения параметров, а качественные выводы, объясняющие природу изменений в базовой лексике языка. При этом следует подчеркнуть, что предложенные соображения никоим образом не умаляют значение полученных ранее (в первую очередь, С. А. Старостиным) результатов, а привлечение новых данных будет стимулировать дальнейшую работу по уточнению уже существующих моделей и разработке новых, более адекватно описывающих предполагаемые реальные лингвистические процессы.
Авторы осторожно дают понять, что главным является НЕ ЗНАЧЕНИЯ ПАРАМЕТРОВ (а на самом деле это и есть главное!), а КАЧЕСТВЕННЫЕ выводы, чего-то там объясняющие. А нам то нужны исторические датировки, полученные глоттохронологией!
Ну а дальше в этом выводе реверансы Учителю и извинения, что его подправили.
И вот это предлагается в качестве инструмента датирования? Спорность аппроксимации, спорность базовых констант. Не-е-ет, пользоваться глоттохронологией - только себя в заблуждение вводить.
МОЙ ВЫВОД: идея с глоттохронологией была хорошая, но, к сожалению относительно точного и независимого аппарата датирования из нее не получилось по вполне объективным причинам.
Вместе с тем, применение численных методов в лингвистике, безусловно, должно быть. Но не только методом тупого сравнения каких-то выхваченных произвольным (да-да!) способом стословников, стодвадцати пяти словников и пр., но и формализацией и последующим компьютерным обсчетом грамматики, прочего. Возможно, найдутся какие-то особенности языков, которые являются внутренними, и развивающимися по своим собственным законам, не зависящим от конкретного этноса, исторического периода и пр. типа мутаций в STR-локусах нерекомбинируемой части Y-хромосомы.