]В принципе можно _легко_ сделать файл типа 23andMe для корректной загрузки на гедматч из bam файла от Данте.
Совместно с уважаемым Daemon2017 мы составили небольшую инструкцию как вырезать из bam'а Y и MT на компьютере с Win 10. Можно дополнить и тем как создать VCF для загрузки на Гедматч.
Беда только в том, что инструкция состоит из картинок и наборов технических фраз. Возможно кто-то "причешет" ее?)))
Думаю это поможет всем клиентам Данте.
Присылайте мне. Вот только в ближайшее время скорее всего заняться ей не получится, так как на мне сейчас два достаточно объёмных дела, и ко второму ещё даже не приступал Может быть, кто-то более оперативно сработает.
В прошлом году я делал файл аутосомы + X формата FTDNA на основе VCF от YSeq, но специфическими наколенными методами, инструкцию для использования на их основе не составить. После добавления отсутствующих снипов из референса результаты этнокалькуляторов полностью нормализовались, но вот поиск родственников, как по мне, стал даже хуже - часть сегментов разорвалась.
Набросок руководства тут.
перепост из группы на фэйсбуке:
The beta version of the program "WGS Extract" is now available for download:
http://37.187.22.93/wgsextract/WGSExtractBeta.zipSource is enclosed.
Here is a description of the software from an earlier post:
"
The idea is that you just need to download the package and install it with one click. All the tools and reference genomes for hg19 and hg38 are already included. The program asks what you want to do (e.g. upload just the part with the Y-Chromosome to Y-DNA Warehouse? Or maybe extract a 23andmeV3 file for an upload to Gedmatch?), then calls the needed tools in the background, and eventually the user has nothing else to do than waiting for the results. The attached screenshots should show the idea.
From a technical perspective, the program is just a GUI that calls Windows compiled versions of the latest samtools etc. in the background. Nothing big, but maybe useful for some non-tech-savvy genealogists. It will be published as open source.
"
The software has still got Beta status. Please report if you find any bugs.
There are several features planned for future version, especially regarding the part of autosomal extraction.
There are also great projects by others, that are very useful for examining your WGS results:
BAM Analysis Kit, 2019 update - very interesting if you have got the BAM file:
https://github.com/teepean/BAM-Analysis-KitDNA Kit Studio - the new version 2.2 now supports gVCF format:
http://dnagenics.com/dna-kit-studio/