Вячеслав, это отлично если Генотек может как-то получше клиентоориентировать свой геномный сервис. Да, VCF удобнее для целей здоровья, тк практически все программы-аннотаторы снипов просят на вход именно VCF. При этом им пофиг, что не было прочитано, главное что было: скрипт видит позицию и генотип в ней - и фигачит ответ, обращаясь например к базе OMIM.
Для филогенетики важно давать большее.
1. Точно различать no call и reference state.
2. Филогенетический коллинг, например как у yfull, требует и числа чтений: даже при плохом скоре единично прочитанный аллель может двинуть образец в нижестоящую кладу.
3. Инделы - тоже не лишнее знание. В редких случаях клада определяется только инделами, значит без оных будет потеря разрешения. STR, как вид инделов - самостоятельная ценность.
Все это можно пихать в VCF. Но нужна явная цель делать именно так, как требуется. Гораздо проще собрать BAM. Ничего кастомного.