Подскажите, пожалуйста, как из таких древних образцов/популяций получается моё приближение к современным?
Типа детский вопрос - где "пряталась" Моя популяция с близким мне набором аутосом или что пришло, что расстояние с 0,02 уменьшилось меньше чем 0,001?
Занудства ради, всё-таки у вас разница не в двадцать раз, а только в три, да и сунгирец действительно более юго-западный по сравнению с типично русскими результатами, он и должен быть дальше.
А так, моя теория заключается в следующем. Расстояния вычисляются по уровню схожести с набором определённых показателей (это не частоты отдельных снипов, а сильно обобщённые результаты их статистической обработки). Эти показатели подвержены определённому разбросу. Поэтому 1) для выборки из нескольких образцов они определяются точнее, чем для отдельно взятого образца, поскольку внутри выборки отклонения частично взаимно гасятся. 2) для современных образцов показатели определяются с меньшим уровнем ошибок, чем для древних, и эта разница зачастую весьма заметна. Видимо, причинами тут как низкое качество чтения, так и деградация дДНК в целом.
Ну и 3), если у вас что-то такое "типично западнорусское" по современным результатам, то соответствующей подобному древней выборки вроде бы и нет. Наверное, можно ожидать относительной близости от RUS_VolgaOka_H, если усреднить. Но помнится, там было невысокое качество прочтения и аутлаеры, которых надо явно исключить. И даже в "славянском ядре" заметный разброс результатов.
upd Подумал, что на всякий случай стоит уточнить. Из-за этого разброса показателей расстояния до реально ближайших популяций будут обычно завышаться. Конечно, возможны и такие искажения, при которых расстояния, наоборот, занижаются, но чаще всё-таки наоборот.