Мито - маленькая молекула, значит, с огромной стохастикой мутирования.
Проблемы две, главные. Одна, известная по Y - обратные мутации. Поскольку обсуждалась тут 10 лет вдоль и поперек (разница фамильных и эколюционных скоростей, поправки Адамова итд), не буду повторяться. Грубо говоря, если у вас в руках истинное дерево и поправки вроде адамовских - то скорее всего, ваш вывод о возрасте дерева не далек от истины. Вторая проблема возникает, когда нет истинного дерева, и понятно, что для Y она имеет мало значения, тк за исключением совсем молодых деревьев родственников, не мутировавших за последние 200 лет на сегменте 10мб - она и не возникает. В Y куда больше маркеров (снипов и СТР), чем в мт, и благодаря полному секвенированию мы обычно знаем, каково истинное дерево. В мт же топология клад возраста до 3000 лет часто не видна даже на полных сиквенсах - тк в молекуле мало маркеров. Большое количество образцов остается идентичными корню, и мы не знаем, как именно они развивались от корня до современного состояния - порознь сразу же, или долго вместе и только недавно разошлись, или может вообще там были мутации, но потом обратились вспять.
Пусть у нас есть некая скорость мутаций, для простоты - эмпирическая (семейная) и в предположении сильной корреляции скоростей во всех ветвях (это называется "жесткий клок"). Где-то есть истинное дерево - все тетечки в данной популяции, происходящие от некой прототетечки, жившей 1000 лет назад. Воображаемое истинное дерево, так мы не обладаем всезнанием. У нас в руках только некое приближение - поддерево истинного дерева, полученное по эмпирическим данным. С его помощью мы хотим оценить возраст истинного дерева. Грубо говоря, если выборочное дерево имеет общую длину 10 мутаций и в среднем мутация возникает каждые 3500 лет, значит суммарно всем ветвям выборочного дерева 35000 лет, по суммарному времени жизни всех кто оставили потомство. Но надо измерить диаметр полученного дерева, в каком-то поперечнике, нам интересен именно диаметр, а не общая длина клубка. Разумеется, мы знаем и сколько там ныне живых персон - пусть их для круглого счета 35.
Все дальнейшее в этом кмт - про то, законно ли сразу взять и поделить длину 35000 лет на 35 и заявить, что 1000 лет и есть возраст? В том и дело, что нет. Поперечники вообще говоря, у деревьев разные. Тем более мы и истинного дерева-то не знаем, а разбежались найти в нем еще и правильный поперечник )))
На практике дерево мт всегда имеет дефекты - его таксоны могут совпадать друг с другом, с корнем, с корнем субклады итп, это нормально для выборок с недавним общим предком. Поэтому мы обязаны подумать, какая может быть ситуация в истинном дереве, топологии которого мы не знаем.
1. Если популяция маленькая (жрать нечего), то истинное дерево имеет малую среднюю степень узлов, то есть при изображении на двумерной евклидовой плоскости с равными поколенными интервалами вытянуто сверху вниз. Почти все его дошедшее до нас разнообразие - недавнее.
2. Если популяция большая (хорошо питалась), то топология истинного дерева ближе к бинарному дереву, есть много базальных или почти базальных ветвей, то есть высоко прикорневое разнообразие. Дерево неплохо помещается в равносторонний треугольник на евклидовой плоскости.
Если возраст реально большой, скажем 5000 лет, то случаи 1 и 2 различимы легко. Во втором случае с корнем совпадет много образцов ("звезда"), в первом - ни одного. Однако на деревьях возраста до 3000 лет в небольших выборках в пределах одного континента, даже с разным размером популяции (скажем финны vs испанцы) - разницу можно не уловить. Тем более, разные субветви могли жить в разных демографических условиях, то есть различие их градуально. Скажем, 1000 лет - деревья запросто могут быть очень разные, а 3000 лет - мало кто мог отсидеться в медвежьем углу совсем рядом с населенными местами, но если мог - это надо учесть. Возможную разницу надо осознавать, представляя истинное дерево. Как оно могло выглядеть в зависимости от истории типа 1 и типа 2.
Когда часы калибруют по популяциям второго типа и потом применяют результаты к популяциям первого типа, то возраст занижается. Пусть наше дерево суммарной длины 35000 лет строилось для 35 живых персон. Эти 35000 лет будут поделены на N=35 во втором случае и получится истинный возраст 1000 лет. Истинное дерево - ветвистое, скажем с 10 почти базальными ветвями. В первом же случае 35000/35 дает те же 1000 лет, но там ранняя часть дерева - допустим всего 2 ствола, и они длиннее вглубь веков. То есть прикорневое разнообразие мало, значит, истинный возраст больше, чем получается при делении Ро на N. То есть где-то там в прошлом есть 1-2 длинные ветви, нагоняющие истинный возраст, но невидимые для филогенетического софта.
Эти соображения известны достаточно давно, втч и Животовскому. Просто для Y с развитием полного секвенирования стали неактуальны. Для мт же от описанной проблемы избавиться нельзя.