Формула может меняться в зависимости от того, сколько гаплотипов включено в сравнение?
Нет
Тогда что означает "Разница по маркёрам выявляется арифметическим образом при сравнении хотя бы двух гаплотипов"?
чтобы посчитать разницу, очевидно, что нужно МИНИМУМ два гаплотипа.
Что такое гаплотип? По сути кортеж (массив, tuple - называйте как хотите) : [значение_маркера_1, значение_маркера_2 ... значение_маркера_Н].
Разницу можно считать по-разному. Как по количеству неодинаковых маркеров у двух протестированных, так и в количестве шагов, с помощью которых гаплотип 1 можно превратить в гаплотип 2.
Почему генетическая дистанция, выраженная в количестве шагов, не может сохраняться с увеличением количества маркеров?
Она может сохраняться. А может не сохраняться. Зависит от того какие маркеры отличаются в гаплотипе 1 и гаплотипе 2.
Пример 1. Имеется два человека, у которых 12 первых маркеров одинаковы, а разница в оставшихся маркерах.
Пример 2. Имеется два человека, у которых различны 5 маркеров из 12 первых, а остальные одинаковы.
Посчитайте разницу в зависимости от того, сколько маркеров для сравнения мы берем.
Разница по маркерам выявляется случайным образом, или СТР-маркеры образуют собственное филогенетическое древо и тестируются в определённом порядке, начиная от корня?
И да, и нет. Поясню. Очень многие пытаются строить деревья по STR. Но т.к. STR мутируют случайным образом и их выборка маленькая (всего 111 в лучшем случае), то и точность построения дерева низкая. Более того - STR может мутировать как в одну сторону, так и в другую, что может приводить к возвратным мутациям, т.е. у далекого предка STR = xx, потом у потомков yy и у современных потомков потомков - xx опять. И Если не угадать с построением дерева, то вот последних потомков можно "пришить" не к той ветке. Поэтому дерево, построенное по STR может не отображать действительность от слова совсем.
SNP НАМНОГО точнее. Вплоть до того, что можно выделить Ваши персональные семейные SNP. Естественно, идет двойная проверка - и по количеству образцов, и по STR данным. Т.е. общее дерево постоянно уточняется и улучшается.