Уважаемый Шад обеспечил меня VCF файлом игрек-хромосомы монгола (Bai et al., 2014). В нем содержится 2441 снип. Предварительно я выяснил, что в позиции 19067134 производный аллель T вместо предкового G. Это означает, что у монгола есть мутация М533. Можно предположить, что его родство с донором образца YF02800 относительно недавнее. Из данных YFull я отобрал 355 снипов уровня D3a1-D3, которые были выявлены одновременно в образцах YF02800 и YF03396. Предварительно отсеял кандидатуры с числом ридов 1 или 2. Сравнение показало, что из 355 кандидатур совпало со снипами монгола 338 позиций. Не совпало - 17 позиций.
Дальнейший анализ этих 17-ти кандидатур производился следующим образом. Две кандидатуры, Y14776 и Y15354, располагаются в соседних позициях - 13960921 и 13960921. Поскольку двойной нуклеотидный полиморфизм не является целью нашего исследования, эти кандидатуры я исключил. Затем просмотрел, как читаются позиции оставшихся 15 кандидатур в других гаплогруппах. Я выбрал группу Q, состоящую из 133 образцов. Оказалось, что в координатах 4-х снипов наблюдается некачественное чтение. Это одновременное чтение и предкового, и производного аллелей в разных образцах одной и той же гаплогруппы, неустойчивые результаты чтения или отсутствие ридов. На нашем жаргоне это называется "пестрота". Таким образом, остается 11 реальных мутаций. Они есть в образцах YF02800 и YF03396, но отсутствуют у монгола.
Есть еще 7 приватных снипов YF02800, которые не были обнаружены в образце YF03396. Этих мутаций не должно быть у монгола. Проверка по снипам монгола показала, что шесть мутаций действительно отсутствуют, но в позиции 3719484 у монгола также производный аллель Т вместо предкового С. Возможно, эта позиция не была прочтена в образце YF03396.
Вывод, который можно сделать по результатам этой стадии исследования: монгол - более удаленный родственник донора образца YF02800 по мужской линии, чем донор YF03396.
Посмотрел VCF файл по монголу из Bai et al., 2014 (далее обозначаю его как MongolD1). Мои выводы полностью совпадают с выводами уважаемого Nimissin.
Результаты анализа показали, что два приватных YF02800 являются общими для YF03396 и MongolD1.
BZ2951 15791171 C T
BZ2952 3719484 C T
Они явно заслуживают перемещения на уровень D-P99. Несмотря на некоторые сомнения по качеству, они есть в трех образцах, что само по себе подтверждает их стабильность.
Все остальные снипы общие только для YF03396 (но некоторые не прочитаны у YF02800, что оставляет вероятность их общности на более высоком уровне, чем D-M533).
При этом по не вызывающим сомнения 11 снипам мы можем выделить под D-M533 отдельную ветвь D-BZ2960 со следующими снипами:
BZ2953 3343829 A G
BZ2954 15743017 C T
BZ2955 17158565 G C
BZ2956 6771724 T A
BZ2957 14799884 A G
BZ2958 15092315 G A
BZ2959 16059911 C T
BZ2960 15940065 T G
BZ2961 17382476 T C
BZ2962 21391681 C T
BZ2963 6201662 A T
Что касается снипов уровней D-P47 и D-M533, то эти ветви заполнятся снипами после появления образцов полного сиквенса D-P99* и D-P47*