Сергей, а как Вы решили проблему с диплоидностью геномов? В сапплементе пишут, что они использовали в GATK вместо UnifiedGenotyper опцию Pileup, но если на определение генотипов у BA64 с помощью Unified Genotyper требуется примерно 52 часа, то в Pileup на это уже уйдет 5 дней. Я почти довел до конца эту операцию, но на диске сервера в последний момент закончилось место
, из-за чего 200 гигобатный vcf урезался (plink его не хочет принимать) . Кроме того, непонятно, как в случае с pileup производить конвертацию в формат Plink.
И еще - Вы пользовались программой MapDamage?