Меня заочно очень уважают:) Я только осваиваю азы, решил начать с чего попроще...
Честно, не советую.
PHYLIP не занимается филогенией ни разу.
Программа глухо рассчитывает количество мутаций между гаплотипами.
А в каком маркере это произошло, быстро- или медленномутирующий это маркер программе по барабану.
Хотя я и не пользовался программами из пакета Phylip уже года два, все же справедливости ради скажу в защиту Джо Фельзенштейна (автор PHYLIP) что программа дает относительно неплохие результаты при анализе ДНК, белковых сиквенсов , если использовать входящие в пакет утилиты, основные на методах ML (максимального правдоподобия) или парсимонических методах. Это утилиты Dnapars,Dnaml, Proml и так далее.
В чем же стоить проблема метода, используемого Клесовым
для построения древ Y-гаплотипов? Напомню, что Клесов для анализа топологии дерева использует программы kitsh/fitsh из пакта PHYLIP для визуализации матрицы дистанции между Y-STR гаплотипами (вычисленную в YUtility).
Обе программы используют либо метод Fitch-Margoliash либо метод Least Squares, основаные на анализе попарной дистанции между таксонами (в нашем случае это микросателлитные данные).На выходе получается
некая топология дерева, которую Клесов потом визуализирует в программе Мега.
Клесова не учитывает слабые места метода попарных дистанций в применении к микросателлитам, т.е к гаплотипам Y.
Во-первых, он не учитывает (или просто не знает), что метод попарных дистанций недооценивает расстояние маршрута между таксонами на древе. Фактически, метод попарных дистанций "срезает углы" дистанций. Здесь хорошая аналогия с географическим расстоянием: расстояние между двумя городами A и B по-прямой может быть 100 миль, но на самом деле человек, идущий из города A в город B из фактически бы обязан пройти 120 миль из-за расположения дорог, местности, остановок в пути и т.д. Есди попарно сравнивать пару таксонов (гаплотипов в нашем случае), то некоторые изменения признаков (значений маркеров), произошедшие у предковых гаплотипов будет просто невозможно определить (это проблема т.н. возвратных мутаций, о которой на Молгене упоминалось уже многократно).
Хотя эта проблема (возвратных мутаций) и является общей для всех методов филогенетический оценки расположения гаплотипов по отношения друг к другу, она особенно актуальна для дистанционных методов, потому что для расчета расстояний между каждой парой гаплотипов в выбоке используются только два гаплотипа, в то время как другие методы (парсимонические и ML) позволяют реконструировать и учитывать наиболее вероятные "промежуточные звенья" - предковые значения в маркерах гаплотипов.
Еще Клесов не учитывает недостатки таких эвристических методов построения древ в Phylip как метод Neighbour-joining, который не позволяет производить сортировку или отбор наиболее лучших деревьев.
Еще одна ошибка Клесова состоит в том, что он не использует включенные в Phylip эвристики для оценки стабильности получаемых древ (типа jackknife, bootstrap). Кроме того, он не видимо не знает, что в той же Меге на основе одного и того же
филипковского файла можно получить сотню, тысячу и даже миллионных альтернативных топологий древ.
Если бы, скажем, я был на месте Клесова и использовал бы PHYLIP для анализа топологии древа (на слэнге Клесова - "выявление ветвей"), то сначала я бы генерировал все возможные в рамках применения метода Fitch-Margoliash топологии деревьев, а затем бы производил оценку надежности методам бутстрэпа (bootstrap). И только затем интепретировал топологию древа в терминах "ветвей гаплогруппы".