Наверное, необходимо пояснить методологические аспекты построения кладограмм X хромосомы.
1.Во-первых, слово "филогения" в данном случае не совсем удачное, так как гаплоблоки X хромосомы являются результатами долгого процесса рекомбинации (в указанном выше проекте приводится калибровка одного рекомбинационного события в пересчете на поколения, причем гаплоблоки варьируются по степени сцепления аллельных значений: минимальное количество поколений на рекомбинационное событие -128 поколений, максимальное -5000 поколений. То есть не смотря на определенную устойчивость самих гаплоблоков, величина периода "распада" гаплоблока разнится примерно в 30 раз. Следовательно, о построении "ДНК-генеалогического" дерева в данном случае говорить некорректно, так как приведенные выше раскладки гаплоблоков участников XDNA проекта скорее отражает кластеризацию участников по степени близости их гаплобоков, поэтому не стоить заморачиваться на анализ топологии "ветвей и ствола дерева".
И хотя в ходе моих экспериментов по визуализации деревьев я использовал в Меге, Флюксусе и Мурке различные bootstrap-алгоритмы (UPGMA, neighbour-joining и максимальную парсимонию), наиболее верным в плане соответствия принципу организации гаплоблоков с неопределенным принципом наследования я нахожу дерево постороенное по методу соединения ближайщих гаплотипов.
2. Во-вторых, необходимо подчеркнуть в выборке представленны данные мульти-снипования X хромосом как мужчин, так и женщин. Поскольку результаты наследования аллелей у женщин неопределены, то в базе данных проекта XDNA многие гетерозиготные аллели в X-хромосомах у женщин помечены знаком * (неопределенный, гетерозиготный признак). Теоретически выравнивание таких сиквенсов X-хромосом (а также сиквенсов с гэпами), видет к неправильному выравниванию сиквенсов по группам, а при визуализации данных в виде кладограмм - к неправильной кластеризации. Поэтому от женских сиквенсов пришлось отказаться, иначе в противном случае неопределенность кластеризации достигла бы критических масштабов.
3.В-третьих, ценность X-хромосомы в генетико-генеалогическом смысле состит в том, что у мужчин она является своего рода индексом происхождения по материнской линии. Генетики подсчитали, что в мужских родословных из общего числа предков, живших 10 поколений назад (1024 человек) только 89 человек "внесли свою генетическую лепту" в передаче наследственных факторов X хромосомы. В 5 поколении предков соотношение передачи наследственных факторов X хромосомы выглядит следущим образом: 25% -прапрадед по линии матери материнского деда, 25% -прапрабабка по линии матери материнского деда, 25% -прапрабабка по линии отца бабушки со стороны матери, 12.5% -прапрадед по линии отца бабушки со стороны матери, 12.5% -прапрабабка по линии отца бабушки со стороны матери.
Теоретически использование кластеризации в анализе XDNA гаплоблоков должно указывать (для двух соседних сиквенсов) на наличие определенного количества общих предков (в более отдаленном прошлом-на принадлежность к общему этно-популяционному фону).
В качестве примера приведу данные по сиквенсам, которые филогенетические программы определили в один кластер с моим сиквенсом
158 50% French Canadian / 50% Swedish H*
78 75% Dutch / 25% Scottish
83 100% Irish
8 Italian (Tuscany)
67 75% German / 25% Alsatian / 12% Catalan / 11% French / 2% Choctaw
39 100% Norwegian (75% Rogaland / 25% Nordland)
64 72% English / 25% German / 3% French
62 62.5% Irish / 34.325% English / 3.175% German
6 British Isles
77 Northern European / 6.25% English
100% Slovak
55 50% German-Russian / 50% Polish U5a1a1
50% Danube-Swabian German / 25% German-Russian / 25% Polish U5a1a1
43 Mostly Irish, some Spanish
20 Ashkenazi
Как видно из приведенного расклада, общий популяционный фон по сравнению моего сиквенса устойчивых XDNA гаплоблоков, на 80-90% соответствует фону, детектируемому Relative Finder'ом и Compare Genes.