Экспериментируя с построением филогенетических деревьей гаплогруппы N по гаплотипам, собранных из разных источников, я пришел к следующим выводам:
- Ни открытые проекты FTDNA, ни база SMGF по отдельности не являются достаточно репрезентативными, чтобы построенные на их основе деревья претендовали на полноценную филогенетическую реконструкцию гаплогруппы N
- Лучше строить совместное дерево NO - так предковые гаплотипы определяются точнее
- TNT находит более оптимальные деревья, чем Network (результаты в смысле длины дерева могут оличаться до 20%!), к тому же может работать с неполными наборами данных
Все это привело меня к мысли построения с помощью TNT общего дерева гаплогруппы NO по 76 маркерам (объединенному набору стандартов FTDNA-67 и SMGF-43). Критерием для включения гаплотипа в набор служило наличие у него всех 34 общих маркеров для указанных стандартов, а также близость (в смысле числа мутаций) к известным гаплотипам N и O, которые прошли SNP-тестирование. Дополнительно все найденные гаплотипы проверялись с помощью YPredictor v.1.0.5 Вадима Урасина. Все дубликаты (включая случаи вложения короткого гаплотипа в длинный) были удалены.
В результате удалось собрать 1071 уникальных гаплотипов, из которых:
- 9 штук (1%) имеют все 76 маркеров
- 14 штук (1%) имеют от 68 до 75 маркеров
- 706 штук (66%) имеют 67 маркеров
- 4 штуки (0%) имеют от 44 до 66 маркеров
- 325 штук (30%) имеют 43 маркера
- 13 штук (1%) имеют от 39 до 42 маркеров
Что касается их национального происхождения, то ситуация такая:
- 477 человек (45%) указали финское происхождение
- 80 (7%) - монгольское
- 71 (7%) – российское (включая татарское, коми, якутское и т.п.)
- 49 (5%) - китайское
- 41 (4%) - литовское
- 39 (4%) - шведское
- 29 (3%) - польское
- 24 (2%) - британское
- 23 (2%) - немецкое
- 23 (2%) - филиппинское
- 16 (1%) - норвежское
- 10 (1%) - украинское
- 10 (1%) - японское
- 9 (1%) - казахское
- 8 (1%) - латышское
- 7 (1%) - белорусское
- 6 (1%) - датское
- 6 (1%) - чешское
- от 1 до 5 представителей у Барбадоса, Венгрии, Вьетнама, Гонконга, Греции, Ирана, Ирландии, Испании, Италии, Комбоджи, Канады, Киргизии, Кореи, Малайзии, Мексики, Нидерландов, Португалии, Румынии, Сербии, Сингапура, Словакии, Таиланда, Эстонии, Швейцарии
- 96 (9%) не знают свое происхождение вообще или до прибытия предков в США
Наконец, вот на какие субклады распадаются эти гаплотипы согласно YPredictor:
- N1c-Tat – 906 штук (85%)
- N1b-P43 – 32 (3%)
- N1*-LLY22g*(xP43,Tat) – 8 (1%)
- O1-MSY2.2 – 37 (3%)
- O2-P31 – 12 (1%)
- O3-M122 – 65 (6%)
- O-M175 – 5
- K*-M9* - 3
- I2*-M438*(xP37.2,S23) - 2
- G2a-P15 - 1
Последние три случая – явная ошибка, о чем я отметил в ветке обсуждения YPredictor.
Ну и наконец само дерево. В результате долгих экспериментов с TNT я понял, что использовать веса маркеров в этой системе (в отличие от Network) смысла нет – они практически не влияют не результат. Поэтому представляю дерево, построенное на маркерах одинакового веса (=1). После нескольких запусков с разными наборами опций удалось найти 6 деревьев оптимальной длины (5604) и построить на их основе консенсусное дерево, которое и изображено ниже в текстовом виде.
Каждый гаплотип идентифицируется двумя символами (кодом страны, совпадающим с национальным Интернет-доменом: fi – Финляндия, mn – Монголия, ru – Россия и т.д.), затем четырехзначным номером в моей выборке (от 0001 до 1071), а затем – через подчерк – индентификатором в ySearch (если он есть), номером тестового набора в FTDNA или указанием на то, что гаплотип извлечен из базы SMGF.
В правой части дерева я отметил известные субклады и ветви.
К сожалению, ограничения форума не позволяют делать посты, содержащие больше 50 тыс.символов, поэтому мое дерево (а я хочу привести его в текстовом виде) будет разбито на несколько частей. Сначала самая древняя – азиатская часть NO:
??? cn0148_G8WJ6 ????????????????? O2-P31
???? ??? kr0035_8G6ER ?
? ???? ??? jp0060_4KRHK ?
? ?????? jp0057_136111 ?
???? ??? ph1003_N70832 ?
? ? ?????? un0981_N89735 ?
? ? ? ??? kh1070_SMGF ?
? ???? ? ??? cn0999_SMGF ?
? ???? ? ??? th1006_SMGF ?
? ???? ???? ??? my1028_SMGF ?
? ? ? ?????? ph1007_SMGF ?
? ???? ??? th1001_SMGF ?
? ? ?????? cn0194_SMGF ?
? ???? ??? cn1000_133044 ?
? ?????? th0998_SMGF ??? O2-P31
?
? ??? jp0002_KGZZX
? ?
? ? ??? bb0606_8Z2MS ????????????????????????????? O1-MSY2.2
? ? ? ??? mn0034_SMGF ?
???? ? ? ? ??? ph0170_SMGF ?
? ? ? ? ? ??? us0150_SMGF ?
? ? ? ? ? ??? cn0145_SMGF ?
? ? ? ???? ? ??? cn0134_SMGF ?
? ? ? ? ? ? ??? us0026_SMGF ?
? ? ? ? ? ? ? ??? cn0152_SMGF ?
? ? ? ? ? ? ?????? cn0151_87YQE ?
? ? ? ? ???? ? ??? jp0980_SMGF ?
? ? ? ? ? ???? ??? jp0997_SMGF ?
? ? ? ? ? ? ?????? jp0169_SMGF ?
? ? ? ? ? ? ??? cn0118_SMGF ?
? ? ? ? ? ???? ??? cn0142_SMGF ?
? ? ? ? ? ? ?????? cn0117_SMGF ?
? ???? ? ? ? ??? cn0136_SMGF ?
? ? ? ???? ? ??? jp0144_SMGF ?
? ? ? ???? ?????? cn0059_B4T5U_EPRG6_P4GCN ?
? ? ? ? ? ? ??? cn0149_SMGF ? O1-MSY2.2
? ? ? ? ???? ? ??? cn0126_SMGF ?
? ? ? ? ???? ??? cn0125_SMGF ?
? ? ? ? ?????? cn0124_SMGF ?
? ? ? ? ? ??? cn0127_SMGF ?
? ? ? ? ?????? cn0123_SMGF ?
? ? ? ? ??? cn0154_SMGF ?
? ? ? ? ??? mn0153_SMGF ?
? ? ? ? ??? mn0147_SMGF ?
? ? ? ? ??? uk0146_SMGF ?
? ? ? ? ??? cn0143_SMGF ?
? ? ? ? ??? cn0137_94451 ?
? ? ? ?????? cn0133_SMGF ?
? ???? ??? us0132_SMGF ?
? ? ??? cn0129_7YJS5 ?
? ? ? ??? my0135_JGCEY ?
? ? ?????? ph0099_SMGF ?
? ? ? ??? cn0131_SMGF ?
? ? ?????? sg0130_rutj6 ????????????????? O1-MSY2.2
? ?
? ? ??? kz0191_39YQU ????????????????????????????? O3-M122
? ? ??? cn0047_U1891 ?
? ? ??? cn0044_F3RTA ?
? ? ? ??? cn0193_SMGF ?
? ? ???? ??? cn0196_SMGF ?
? ? ? ?????? cn0195_SMGF ?
? ? ? ??? cn0049_5PEEE ?
? ? ???? ??? cn0050_F6K2C ?
? ? ? ???? ??? cn0052_RHP92 ?
? ? ? ?????? cn0051_tqyrg ?
? ? ? ??? ph0188_SMGF ?
? ? ? ???? ??? jp0180_SMGF ?
? ? ? ? ?????? ph0174_SMGF ?
? ? ? ? ??? ph0183_SMGF ?
? ? ? ???? ??? th0182_SMGF ? O3-M122
? ? ? ? ???? ??? ph0179_SMGF ?
? ? ? ? ?????? ph0178_SMGF ?
? ? ? ? ??? ph0171_SMGF ?
? ? ???? ? ??? us0173_SMGF ?
? ? ? ???? ?????? ph0172_SMGF ?
? ???? ? ???? ??? ph0187_SMGF ?
? ? ? ???? ??? ph0192_SMGF ?
? ? ? ?????? ph0190_SMGF ?
? ? ? ??? ph0181_SMGF ?
???? ? ? ? ??? un0046_YNSMB ?
? ? ???? ???? ??? ph0048_SMGF ?
? ? ? ? ?????? ph0045_SMGF ?
? ? ???? ??? ph0189_SMGF ?
? ? ? ??? ph0184_SMGF ? O3-M122
? ? ?????? ph0175_SMGF ?
? ? ? ??? ph0177_SMGF ?
? ? ?????? ph0176_SMGF ?
? ? ??? cn0042_SMGF ?
? ? ?????? mn0041_SMGF ?
? ? ? ??? cn0043_27280 ?
? ? ???? ?????? hk0001_K9AYS ?
? ? ? ???? ??? un0161_M6131 ?
? ? ? ???? ??? kz0160_S6BUC ?
? ? ? ?????? cn0010_CZG2Z ?
? ? ? ??? mn0022_SMGF ?
? ???? ? ??? ph0012_SMGF ?
? ? ? ???? ??? kz0030_4V9MV ?
? ? ? ? ???? ??? mn0028_SMGF ? O3-M122
? ? ? ? ???? ??? kz0029_QDUG4 ?
? ???? ? ?????? kz0027_GC7PT ?
? ? ? ??? vn0021_106389 ?
? ? ? ???? ??? mn0120_SMGF ?
? ? ? ? ???? ??? us0155_9WG2Q ?
? ? ? ? ???? ??? hk0040_SMGF ?
? ???? ? ?????? cn0039_CJM6A ?
? ? ???? ??? ca0038_SMGF ?
? ? ? ? ??? cn0036_SMGF ?
? ? ? ? ?????? mn0018_SMGF ?
? ? ? ? ? ??? mn0013_SMGF ?
? ? ? ???? ??? us0017_SMGF ?
? ? ? ???? ??? mn0014_64EF4 ?
? ???? ???? ??? mn0016_SMGF ? O3-M122
? ? ?????? mn0015_SMGF ?
? ? ??? cn0020_SMGF ?
? ? ?????? jp0019_SMGF ?
? ? ? ??? kg0025_SMGF ?
? ? ? ??? mn0024_SMGF ?
? ???? ??? cn0023_SMGF ?
? ? ? ??? cn0122_ETJGF ?
? ??????? ??? kr0138_SMGF ?
? ? ?????? mn0121_SMGF ?
? ? ??? cn0037_SMGF ?
? ? ?????? cn0011_SMGF ?
? ???? ??? mx0033_SMGF ?
? ???? ??? cn0032_SMGF ?
? ?????? kg0031_SMGF ??? O3-M122
?
? ??? rs1010_N84884 ???? N1* (xTat,P43)
? ?????? sk1009_UX7PM ?
? ???? ??? it1027_N14100 ?
? ? ???? ??? us1026_VQE8J ?
? ? ?????? us1025_AJ7QP ?
? ? ??? pl0053_PVVT8 ?
? ? ???? ??? cn0058_SMGF ?
? ? ? ?????? cn0054_SMGF ???
? ? ?
? ? ? ??? ru0093_93467 ???????????????????????? N1b-P43
? ? ? ???? ??? ru0092_MBPWB ?
? ? ? ? ???? ??? jp0095_SMGF ?
? ? ? ? ?????? mn0094_SMGF ?
???? ? ? ??? ru0090_XA5JB ?
? ? ? ? ??? mn0079_SMGF ?
? ? ???? ? ? ??? mn0081_SMGF ?
? ? ? ? ???? ??? mn0078_SMGF ?
? ? ? ? ? ?????? mn0076_SMGF ?
? ? ? ? ? ? ??? mn0096_SMGF ?
? ? ? ? ? ?????? mn0080_SMGF ?
? ? ? ???? ??? mn0077_SMGF ?
? ? ? ? ??? mn0091_SMGF ?
???? ? ? ??? kg0056_SMGF ?
? ? ? ? ??? mn0086_SMGF ?
? ? ? ? ? ??? mn0085_SMGF ?
? ? ? ???? ??? mn0084_SMGF ?
? ? ? ? ? ? ??? mn0158_SMGF ? N1b-P43
? ? ???? ????????? mn0157_SMGF ?
? ? ? ? ??? mn0088_SMGF ?
? ? ? ?????? mn0087_SMGF ?
? ? ? ??? pl0128_RCQJT ?
? ? ? ? ??? ru0083_121620 ?
? ? ???? ? ??? mn0159_SMGF ?
? ? ? ? ??? mn0089_SMGF ?
? ? ???? ??? ru0082_SMGF ?
? ? ? ??? cz0075_SMGF ?
???? ? ? ??? mn0098_SMGF ?
? ????????? mn0097_SMGF ?
? ? ??? fi0003_172247 ?
? ? ???? ??? ru0009_104256 ?
? ? ? ?????? ru0008_JGR55 ?
? ???? ??? fi0007_160881 ?
? ? ??? fi0006_SMGF ?
? ?????? fi0005_V8ZUS ?
? ??? fi0004_134409 ????? N1b-P43
?
? ??? mn0070_SMGF ????????????????????????????????????????????????????????????????? N1c-Tat
? ? ??? ru0055_SMGF ?
? ? ? ?
? ? ? ??? ru0119_2JUVS ???????????? N1c-Volga ?
? ? ???? ??? un0072_152820 ? ?
? ? ? ???? ??? ru0068_PTAXF ? ?
? ? ? ???? ??? ru0074_TECXZ ? ?
? ? ? ?????? ru0073_WWRET ??? ?
? ? ? ?
? ? ? ??? ee0109_GX848 ????????? N1c-Yakut ?
? ? ? ? ??? ru0106_69ZKR ? ?
? ? ? ???? ? ??? mn0321_SMGF ? ?
? ? ? ? ???? ??? mn0320_SMGF ? ?
? ? ? ? ?????? mn0319_SMGF ? ?
???? ? ? ??? mn0318_SMGF ???? ?
? ? ? ?
? ? ? ??? mn0399_SMGF ?
? ? ? ???? ??? ru0407_89M3G_EYHYE ?
? ? ? ? ?????? ru0406_152846 ?
? ? ? ? ?
? ? ? ? ??? ua0425_FH3XK ??????????????????????????????????? N1c-Mongol ? N1c-Tat
? ? ? ? ? ??? mn0322_SMGF ? ?
? ? ? ? ? ? ??? mn0329_SMGF ? ?
? ? ? ? ? ? ??? mn0328_SMGF ? ?
? ? ? ? ???? ??? mn0327_SMGF ? ?
? ? ? ? ? ? ??? mn0326_SMGF ? ?
? ? ? ? ? ?????? mn0324_SMGF ? ?
? ? ? ? ???? ??? mn0323_SMGF ? ?
???? ? ? ? ? ??? mn0223_SMGF ? ?
? ? ? ? ? ? ??? mn0325_SMGF ? ?
? ? ? ? ? ?????? mn0100_SMGF ? ?
? ? ? ? ? ??? fi0402_129598 ? ?
? ? ? ? ? ? ??? fi0356_173859 ? ?
? ? ? ? ???? ? ??? kz0412_63CDM ? ?
? ? ? ? ? ? ? ??? mn0300_SMGF ? ?
? ? ? ? ???? ? ? ??? kz0278_CTT96 ? N1c-Mongol ? N1c-Tat
? ? ? ? ? ? ? ? ??? mn0311_SMGF ? ?
? ? ? ? ???? ? ? ? ??? ir0266_SMGF ? ?
? ? ? ? ? ? ???? ? ??? mn0269_SMGF ? ?
? ? ? ? ? ? ? ???? ? ??? mn0388_SMGF ? ?
? ? ? ? ???? ? ???? ??? mn0342_SMGF ? ?
? ? ? ? ? ? ???? ??? mn0442_SMGF ? ?
? ? ? ? ? ? ???? ??? pl0428_BE222 ? ?
? ? ? ? ? ? ?????? ru0387_PC7AG ? ?
? ? ? ? ? ? ??? mn0273_SMGF ? ?
? ? ? ? ???? ??? mn0272_SMGF ? ?
? ? ? ? ? ? ??? mn0271_SMGF ? ?
? ? ? ? ? ?????? mn0270_SMGF ? ?
? ? ? ? ? ? ??? cn0224_SMGF ? ?
? ? ? ? ? ?????? mn0221_SMGF ? ?
???? ? ? ? ? ??? mn0283_SMGF ? N1c-Mongol ? N1c-Tat
? ? ? ? ???? ??? kg0668_SMGF ? ?
? ? ? ? ? ?????? kz0282_26SXQ ? ?
? ? ? ? ? ??? mn0281_SMGF ? ?
? ? ? ? ? ??? ua0268_SMGF ? ?
? ? ? ??????? ??? mn0277_SMGF ? ?
? ? ? ? ? ??? mn0276_SMGF ? ?
? ? ? ? ???? ??? mn0298_SMGF ? ?
? ? ? ? ?????? mn0275_SMGF ? ?
? ? ? ? ??? mn0274_SMGF ? ?
? ? ? ? ??? mn0287_SMGF ? ?
? ? ? ? ??? mn0263_SMGF ? ?
? ? ? ? ? ??? mn0288_SMGF ? ?
? ? ? ? ?????? mn0286_SMGF ? ?
? ? ? ? ? ??? mn0308_SMGF ? ?
? ? ? ? ? ??? mn0296_SMGF ? N1c-Mongol ? N1c-Tat
? ? ? ???? ??? ru0295_SMGF ? ?
? ? ? ? ??? ru0294_SMGF ? ?
? ? ? ? ??? mn0293_SMGF ? ?
? ? ? ? ??? ru0292_SMGF ? ?
? ? ? ? ??? ru0291_SMGF ? ?
? ? ? ? ??? ru0290_SMGF ? ?
? ? ? ?????? mn0285_SMGF ? ?
? ? ? ??? ru0284_SMGF ? ?
? ? ? ??? mn0225_SMGF ? ?
? ? ? ??? mn0220_SMGF ? ?
? ? ? ? ??? mn1033_SMGF ? ?
? ? ? ?????? ru1032_SMGF ? ?
? ? ? ? ??? ru0313_SMGF ? ?
? ? ? ?????? mn0303_SMGF ????????? N1c-Mongol ?
???? ? ?
???? ?
??? N1c-European ???????????????????????????????????????????????????? N1c-Tat