Вы полагаете, что вероятность мутации любого маркера одинакова
Нет, это было упрощение для примера на кубиках. На самом деле я считаю, что скорость мутации разных маркеров разная. Даже вычислял ее.
http://www.rodstvo.ru/forum/index.php?showtopic=1131и эти события независимы в последовательности.
да, предполагаю, что независимы.
Попробуем ее оценить эту вероятность. Я имею выборку из 1000 персон, с которыми имеется полное совпадение по 12 маркерам и 100 других персон, с которыми у меня расстояние 1 по 12 маркерам. Предположим, что произошло N копирований (испытаний) общего предка. Отношение имеющихся величин характеризует среднее число результатов испытаний в которых произошла хотя бы одна мутация. Для равномерно распределения среднее 0.1 численно равно вероятности этого события. Отсюда, решая уравнение 12 степени получим вероятность мутации любого маркера, что дает приблизительно 0.01. увеличение последовательности до 25 маркеров приведет к увеличению вероятности 1 мутации в ней не боле 10%, чем пренебрегаем. Вероятность возникновения двух мутаций в последовательности из 25 маркеров составит величину в промежутке от 0.01 до 0.001.
В моем случае на 1000 персон у меня имеется лишь 2 персоны, с которыми у меня расхождени 2 на 25 маркера, что совпадает с оценкой.
Вывод следующий. Если не обнаружено полных сопадений по 25 маркерам среди имеющихся персон в базе, то моя сдача теста на 67 маркеров не привдет к выявлению среди них персон более близких. Я могу лишь получить среди имеющихся еще несколько персон с расстоянием 3-4 шага, за счет мутаций на дополнительных маркерах, что ни добавит никакой информации.
Так ли это?
Практика показывает, что иногда тестирование 67 маркеров находит Вам более близких соседей, чем тестирование 25. Причем, я оценил бы вероятность нахождение более близких как 1/2
Ведь мы исходя из статистических данных (2 мутации на 25 маркерах) оцениваем количество поколений. Если вычислять не точечную оценку, а распределение, то по отношению к нему точечная оценка будет значение мат. ожидания распределения. Но реальное количество поколений с вероятностью примерно 1/2 меньше этого мат. ожидания и с вероятностью примерно 1/2 больше мат. ожидания.
Значит получая дополнительную информацию о количестве поколений (тестируя 67 маркеров) и этим смещая точечную оценку к реальному количеству поколений мы с вероятностью 1/2 приближаем общего предка.
Таким образом, половина тех, кто находится от Вас на расстоянии трех мутаций на 25 маркеров приблизятся к Вам, как Вы уже написали. Насколько они будут ближе, чем те кто сейчас на расстоянии 2 мутаций на 25 маркерах - можно конечно посчитать, но жаль на это тратить время. Если есть желания, то вероятности мутаций первых 25 маркеров и всех 67 Вы найдете по вышеуказанной ссылке.
И все же более точно зная, кто из "соседей" ближе и учитывая кто где живет Вы получаете дополнительную информацию о месте проживания Ваших предков.
И даже информация, что кто-то дальше от Вас, чем был на 25 маркерах привнесет дополнительную информацию - Вы их сможете не учитывать как близких родственников.
Все же рекомендую сделать тест на 67 маркеров