С целью критического обсуждения и мозгового штурма методов построения филогенетических деревьев выложил в
сетевой альбом ряд филогенетических деревьев гаплогруппы I2a2.
При построении деревьев использовалась новые возможности Murka 1.1.13 - MJ-эвристика и MP обработки получившейся сети с учетом исходных весов (weighted heuristcs) (WPHEUR -b 30 -f"") и редукция штейнеровских деревьев (CUTDRA). Использовалась неравновесная метрика. Остальные параметры остались прежними, в том числе и исходные веса ув.
wertnera.О характере выборки: использовалась выборка из 113 гаплотипов одинаковой длины (25 маркеров). Отбор производился из коллекции I2a гаплотипов ув.
wertnera. В-первую очередь отбирались подтвержденные SNP-тестом (M423,P41.2) гаплотипы, затем из общей выборки выбирались гаплотипы с профильными для I2a2-Din значениями. Затем из полученной выборки были исключены гаплотипы с значениями профильных маркеров, близкими к модальным значениям двух близкородственных субкладов - I2a2-Isles и I2a2-Disles. В неопределенных случаях, исключались гаплотипы I2a2 из Британии и Ирландии.
В итоге осталось выборка, включающая в себя гаплотипы
венгров Баната,Словакии,Трансильвании и Буковины; словаков, поляков, карпаторусинов, хорватов,словенцов,сербов,украинцев,белорусов, русских. Кроме этого, в выборке представлено несколько ашкенази, по одному немцу,австрийцу, албанцу, итальянцу.Территориальный охват выборки примерно соответствует
границам Австро-Венгерской империи в 1889 году.
Предварительный тест на молекулярную дисперсию (AMOVA) не проводился, так как выборка организовывалась по принципу максимального Y-хромосомного генотипического сходства. Поэтому генетическая вариативность между группами по этническим и географическим признакам не должны существенно отличаться от прогнозируемого.
Теперь пару замечаний о топологии полученных деревьев. Я, в принципе, согласен с выводом ув. Валерия З. по вопросу о достоверности парсимонии: "
парсимонистские филогении, основанные на коммерческих 17,25,37 локусах У-хромосомы, случайны и ненадежны."
Поэтому для анализа достоверности генерируемых деревьев использовался анализ построенных деревьев по четырем признакам:
1) оценка
rho (которая варьируется в зависимости от MP-древа) - величина
мю (суммарное число мутаций гаплотипа-потомка, накопленное от предкового гаплотипа), рассчитываемая по методу С.П.Каржавина, должна совпадать с величиной rho
Оценка деревьев I2a2 по этому пункту не проводилась.2) оценка уникальности топологии -все вычисленные штейнеровские MP-древа в случае достоверности построений, должны минимально различаться по топологии.
Рассматриваемые деревья Hg I2a2 в целом не значительно отличаются по топологии, хотя в древе присутствуют "случайные ветви" 3) оценка mppart ветвей -анализ частоты соответствующей партиции (ветви) среди всех изученных MP-деревьев. Оценка параметр mppart позволяет выявить "случайность" размещения "оппортунистической ветви" (
(c) AK ) в данном древе. По наблюдениям Валерия, средняя частота партиций достоверных по другим признакам деревьев равна значению >=0.95. То же самое можно сказать о достоверности ветвей:
Цитата Валерия:
Степень "типичности" партиций гаплотипов в дереве (то есть встречаемость их в других деревьях той же степени оптимальности) имеет большое значение при рассмотрении топологий; значительное число редких партиций в дереве свидетельствует о случайности его топологии, и в случае когда это характерно для всех оптимальных деревьев, можно говорить об отсутствии явного филогенетического "сигнала" в исходных данных. Ниже приведен пример одного из построенных деревьев, каждое ребро снабжено отметкой [mppart=...] частоты соответствующей партиции среди всех изученных MP-деревьев.
В анализируемом случае частота партиций древьев I2a2 в среднем укладывается в интервалы частоты достоверных деревьев.4. Оценка расстояния Робинсона-Фоулдса между построенными деревьями:
среднее расстояние между деревьями не должна превышает выверенный порог средних расстояний в 0.15-0.2, за которым достоверная реконструкция истории мутаций STR невозможна.
Среднее расстояние между филодеревьями гаплогруппы I2a2 - округленно 0.10- не превышает выверенный порог средних расстояний в 0.15-0.2.