Вы занимаетесь разветвленными связями (у предка не один потомок, а некое множество), я давно уже - исключительно неразветвленными (в расчете времени участвуют два гаплотипа, третьему места нет). Понятие "возвратная" мутация я тоже не приветствую, потому что оно субъективно, зависит от точки зрения. Но если у Вас в неком маркере 7 тандемных повторов, а у меня - 9, то что такое разность 9-7=2? Число мутаций на маршруте от Вас до меня или обратно? не совсем так.
Тут я и употребляю "наблюдаемое число мутаций"
Дело в том, что я СПЕЦИАЛЬНО получил максимально правдоподобную оценку для случая сравнения ДВУХ гаплотипов, именно с учетом неразветвленности. Эта оценка потому и называется МАКСИМАЛЬНО ПРАВДОПОДОБНОЙ, что НИКАКИЕ ИНЫЕ оценки лучшего результата уже не дадут (конечно, в рамках принятой математической модели мутаций и изменения аллелей). Эта процедура, правда несколько тяжеловесно, изложена в http://rjgg.molgen.org/index.php/RJGGRE/article/view/26 . Сейчас я написал менее запутанный алгоритм, который с пол-пинка реализуется на любом персональном компьютере.
Данная процедура не требует понятий возвратные и наблюдаемые мутации, а опирается на естественные интенсивности (скорости) мутаций, вычисляемые по парам "отец-сын".
Но если у Вас в неком маркере 7 тандемных повторов, а у меня - 9, то что такое разность 9-7=2? Число мутаций на маршруте от Вас до меня или обратно? не совсем так.
Тут я и употребляю "наблюдаемое число мутаций"
Попробую объяснить на данном примере суть метода максимума правдоподобия для сравнения двух гаплотипов.
Пусть имеем два одномаркерных гаплотипа, у одного аллель 9, а у другого - 7. Максимально правдоподобной оценкой количества РЕАЛЬНО ПРОИЗОШЕДШИХ МУТАЦИЙ будет 2. Почему так? Да потому, что вероятность того, что произошло только две "прямых" мутации выше, чем вероятность того, что было 3 "прямых" и одна "обратная", и уж тем более, значительно менее вероятно, что было 4 "прямых" и 2 "обратных" мутации.
Ну, а теперь пусть у нас гаплотипы, скажем из 2-х маркеров: {9,10} и {7,10}. Причем, скорость мутаций во 2-м маркере, скажем, в 10 раз выше, чем в 1-м (в котором есть разница в аллелях). В этом случае максимально правдоподобной оценкой будет уже не 2 мутации, а 3 или более (я "на пальцах" посчитать не могу, конечно). Дело в том, что если в медленном маркере произошло как минимум две мутации, то очевидно, что вероятность того, что в быстром не было ни одной мутации очень мала и в итоге такая ситуация сразу по двум маркерам МАЛО ПРАВДОПОДОБНА для случая реального осуществления всего 2-х мутаций в 1-м (медленном) маркере.
Конечно, все намного сложнее для гаплотипов с большим количеством маркеров, но общий принцип в том, что участвуют в "взвешивании" степени правдоподобности всевозможных сочетаний мутаций ВСЕ скорости маркеров.
И никаких наблюдаемых или возвратных мутаций, а только вполне естественные истинные мутации.
Поэтому, когда я вижу как сравнивают пару гаплотипов и какие-то там разности аллелей вычисляют суммарно по всем маркерам, то это очень неэффективная оценка (хотя, в ряде случаев она вполне может совпадать и с максимально правдоподобной оценкой, но анализировать такую упрощенную процедуру ради того, что многие ее применяют, не буду).