Вопрос в первую очередь к тем форумчанам, кто некоторым образом причастен к созданию калькуляторов...
Много ли при расчете этнопринадлежности зависит об собственно используемого калькулятора?
Ведь не секрет, что задействованные в них компоненты называются очень по-разному, и вообще это все из серии "так автор видит мир". А простого пользователя интересуют в первую очередь не эти абстрактные проценты, а результаты Оракла.
Допустим (для простоты картины мира), что оба Оракула (и простой, и четырех предков) с точки зрения используемых матметодов удовлетворяют возложенным на них требованиям. Следующий момент - качество выборок, а также их количество (и в смысле детализации по этносам, и в смысле количества людей в каждой из выборок). Важность этого пункта, я думаю, ни у кого сомнений не вызывает. И если оракул показывает странный результат - ИМХО логичнее всего грешить на выборки (либо на их общую скудность вкупе с сомнительностью "участников", либо на нераскрытую тему Восточной Европы)))
Но вот допустим, что для каждого из Гедматчевых калькуляторов есть отличные выборки (допустим даже выборки одни и те же, но прогнанные на каждом калькуляторе отдельно) Будут ли калькуляторы показывать по одному и тому же человеку в оракуле примерно одинаковые результаты? Или все равно результаты будут разниться, будут более "отсталые" и более современные калькуляторы, более и менее подходящие тому или иному этносу? А можно ли теоретически заложить в калькулятор такой косяк, что даже при наличие отменных выборок для него, все равно каждого нового юзера будет размазывать как бог на душу положит?
Попробую ответить тезисно, иначе придется накатать целую заметку.
Компоненты Admixture-этнокалькуляторов у разных авторов довольно схожи между собой, но акценты действительно могут различаться. Это зависит и от выборок, и от количества компонентов, и от произвола автора. Однако в большинстве случаев они все же отображают объективную реальность. На текущий момент выборки не являются слабым звеном. Совсем не обязательно иметь подробную выборку от каждого народа, потому что этнокластеры гораздо древнее современных этносов. Искажение результатов в большинстве случаев вызвано так называемым "эффектом калькулятора", в свежих версиях Eurogenes и MDLP K23b он убран.
После того, как мы получили для тестируемого раскладку по предковым компонентам, эту информацию обрабатывает оракул. Он сравнивает ее с результатами по разным выборкам и ищет наиболее похожую. В смешанном режиме он ищет вариант смешения, результат которого будет наиболее похож. Если в калькуляторе выделено мало кластеров, то близкие народы могут быть слишком похожи между собой для уверенного различия, если слишком много - вырастает шум. Для Восточной Европы мне наиболее нравится разбивка на кластеры в калькуляторе Веренича K27.
Увеличение количества кластеров на ступеньку обычно происходит путем расщепления одного из имеющихся на два родственных (с возможным небольшим перераспределением среди остальных). Можно сказать, что при этом мы постепенно движемся от древности к нашим дням. Но до современных народов в большинстве случаев так не добраться. Даже если выделить специфичные "финский" или "ашкеназский" кластеры, у родственных народов он тоже будет присутствовать, лишь в меньшем количестве.
Современные народы рассматриваются как результат смешения более древних предковых популяций. Если человек смешанного происхождения, он может оказаться похож на не (близко) родственный ему народ, в котором предковые компоненты смешались в схожих пропорциях, только в другую эпоху. Или же наоборот, происхождение у человека несмешанное, а в режиме смеси оракул показывает, какие комбинации могли породить похожий на него результат.