Ещё замечание и пожелание.
Команда YFull известна хорошей математической подготовкой. Как раз для мтДНК тут непаханное поле. Точнее - я хочу затронуть тему TMRCA.
Несмотря на огромное количество работ, связанных с изучением скорости мутаций мтДНК, я до сих пор не встретил сводной работы, которая учитывала бы все возможные факторы. В основном, исследования проводятся методами изучения родословных и методами филогении. Однако, на мой взгляд, не принимается во внимание, например, численность населения и некоторые другие (на самом деле их сходу можно немало назвать) факторы.
В результате, формулы расчета времени TMRCA для мтДНК чаще всего являются упрощенными и приводят (на мой взгляд) к значениям, ставящим потребителей (да и исследователей, честно говоря) в тупик. Например, если посмотрим на распределение времен TMRCA для гаплогруппы U (согласно дереву YFull), то видим, например, явно выделенный пик для TMRCA = 1000 лет (среднее же значение показателя TMRCA для подгрупп данной гаплогруппы составило 7700):
Получается, что скоро многие
начнут искать события примерно 1000-летней давности, которые могли привести к связи между их предками.
Чтобы убрать пик TMRCA 1000 - надо учесть разные скорости мутаций соседних снипов (а у мтДНК они могут очень сильно отличаться - так, некоторые снипы могут вообще не мутировать, так как мутации в них просто приводят к нежизнеспособному потомству; другие же снипы могут мутировать вообще чуть ли не каждое поколение). Например, мутация A13434G является вполне себе пристойной (и даже встречается в разных гаплогруппах), а вот соседи T13433 и C13435 в мутациях вообще не были замечены!!!
А вот еще один рядом расположенный снип C13440T - встречается более чем в 10 раз реже, чем A13434G - следовательно, если для A13434G TMRCA будет 700 лет, то для C13440T - должно быт 7000 лет...
Теперь глянем, как может повлиять рост населения планеты (
внимание - все значения приводятся лишь для примера).
Еще внимание - тут я немного
путаю термины "скорость мутации" и "вероятность возникновения мутации" - но уж простите, просто немного лениво точно выражаться.
Предположим, что скорость мутации (для популяции в целом) зависит от количества населения:
Получаем довольно забавный результат, не правда ли?
Разумеется, результат совершенно неверный в общем случае (да и расчет производился для популяции планеты, а не рассматривался весь процесс наследования). Есть огромное количество иных факторов, которые влияют в разные стороны
Для примера были взяты "базовые" частоты мутаций HVR I и II из работы:
Soares, Pedro et al. Correcting for Purifying Selection: An Improved Human Mitochondrial Molecular Clock // The American Journal of Human Genetics, Volume 84, Issue 6, - pp. 740-759.
Этим частотам волюнтаристски был ассоциирован год -5000 (5 тыс. до н.э.) - без особых оснований, просто это примерно -7700 лет, которые в среднем имеют субклады гаплогруппы U (при незаконченном еще расчете YFull).
Расчет населения планеты производился согласно:
Капица С.П. Феноменологическая теория роста населения земли // Успехи физических наук, 1996, том 166, №1. - с. 67.В плане заключения. Как мне кажется, можно вообще сделать "ход конём" и не думать о степени влиянии разных факторов и т.п., а просто привлечь "искусственный интеллект" (точнее, машинное обучение), тем более что сейчас есть возможность его использовать (как правило, в облачных сервисах, конечно). Для мтДНК, на мой взгляд (я пока лишь чуть-чуть поэкспериментировал с этим) это приводит к крайне интересным результатам и я полагаю, что картина TMRCA может кардинально измениться и проясниться.