Я завершил анонсированное исследование и представляю полученные результаты.
Но сначала остановлюсь еще раз на методике: я извлек из базы Y-DNA Фонда Соренсона (
www.smgf.org) выборку 43-маркерных гаплотипов, построенную следующим рекурсивным способом:
- выборка содержат модальный гаплотип N1c (точнее, максимально похожий на него из представленных в SMGF),
- если в SMGF имеется гаплотип, имеющий 70% и более совпадение по маркерам с одним из представленных в выборке, то он включается в выборку
Действуя в точности в соответствии с представленным алгоритмом, мне удалось извлечь из SMGF 164 гаплотипа. Я также добавил к ним три похожих (в соответствии с алгоритмом) гаплотипа из ySearch (S5HUP, Z9GMS, GRP6J). По данной выборке 167 гаплотипов было построено филогенетическое дерево (сеть) в Network методом соединения медиан (median joining) с последующим удалением неиспользуемых медианных векторов (MP option).
Сначала я попробовал использовать Network с равными весами маркеров, но результат меня не удовлетворил (сеть содержала много циклов, не было четкого разделения ветвей).
Веса уважаемого wertner помогли построить сеть с разделением на ветви, но в результате я остановился на третьем варианте (давшем лучшие результаты, чем два первых): я взял частоты мутаций из
работы специалистов SMGF (откалиброванные по 8 тыс. гаплотипам) и, используя метод, описанный wertner'ом на форуме rodtsvo.ru, перевел их в веса для Network (справедливости ради замечу, что отличия от дерева с весами wertner минимальные).
В результате получилось предлагаемое вашему вниманию дерево с небольшим число циклом и с четким разделением ветвей:
Раскрашивая дерево, я старался по возможности использовать рекомендованные уважаемым moglley цвета (приводу их в десятичном формате RGB):
- желтый yellow (255,255,0) - финны (52 гаплотипа в выборке)
- аква aqua (0,255,255) - монголы (38)
- зеленый lime (0,255,0) - шведы+норвежцы (14+5)
- синий blue (0,0,255) - немцы+поляки+украинцы (6+4+2)
- розовый pink (255,192,203) - британцы ( 8 )
- голубой white blue (173,216,230) - литовцы (6)
- красный red (255,0,0) - россияне (6)
Представителей остальных наций в выборке немного (26), я их оставил белыми.
Две ветви в этом дереве имеют четко выраженную национальную окраску (я их выделил).
Я также вычислил возраст этих веток в Network по ро-статистике, равно как и возраст всей выборки (из посылки, что корень древа находится в центре - где крестом расходятся четыре основные ветви - там же поблизости расположен модальный гаплотип выборки).
Монгольская ветвь имеет возраст (в мутациях) 12.3 со среднеквадратичным отклонением (сигмой) в 2.3.
Как перевести мутации в года? Я просуммировал откалиброванные частоты мутаций всех 43 маркеров, взяв данные из вышеупомянутой работы SMGF, получив 0.101 мутаций на гаплотип. Считая возраст поколения за 25 лет, я получил, что одна мутация происходит в среднем раз в 247 лет.
Получается, монгольская ветка имеет возраст примерно в 3000 лет (с 95% достоверностью плюс-минус две сигмы, т.е. 1100 лет).
Финская ветка имеет возраст в 1750 лет (плюс-минус 430 с достоверностью 95%), а всю выборку можно оценить в 3300 плюс-минус 650 лет.
Собственно, данная выборка (при всей ее условности) в очередной раз подтверждает известную гипотезу: гаплогруппа N1c зародилась где-то в степях Моноголии.
Что же касается того, сохранились ли следы монгольских завоеваний XIV в. в генофонде Европы, то вы сами можете отлично это видеть - на монгольских ветках сидят свежие (по историческим меркам) немонгольские отростки.
Хочу выслушать вашу критику, после чего готов поделиться выборкой гаплотипов с любым желающим.