Nebula вместо сырого bam файла выдает cram. Это сжатый bam. С точки зрения загрузки на Yfull разницы нет, они сами все сделают. А вот если вы хотите извлечь аутосомы то самый простой и удобный способ это программа WGS Extract
https://wgsextract.github.io/Эта программа к сожалению пока cram не понимает. Получается, что нужно сначала произвести конвертацию. Сделать это можно либо самому, скачав на локальный компьютер. Либо через сервис usegalaxy.org. Разобраться с usegalaxy.org не так просто новичку, но интересно.
Если хотите сами то можно воспользоваться инструкцией из FB группы Nebula\Dante
https://docs.google.com/document/d/1pm-7jDK9-Xc1_RsukOFTiOBazgMtDLT22oyqvZpBQNc/edit?fbclid=IwAR0udJjH-A-uoFDYX4FaCjf4RUCD8vePALSWuwZN5aZRPxIPDs25_RrRJ8kЕсли под windows, то рекомендуется win10 x64. Команда следующая samtools view -b -T GCA_000001405.15_GRCh38_no_alt_analysis_set.fna -o NB7FB4472.bam NB7FB447.cram --threads 4
GCA_000001405.15_GRCh38_no_alt_analysis_set.fna это референс. Его можно найти в папке wgsextruct. Распаковать и скопировать в папку где находится samtools.
NB7FB4472.bam -выходной файл, название сами указываете нужное.
NB7FB447.cram -входной файл. Укажите точно как ваш cram называется.
--threads 4 - опционально, количество потоков. 4 указан для 4х поточного CPU.
Есть еще способ загрузить на sequencing.com и там купить за 19$ инструмент по конвертации.
С bam файлом можно потом поработать с помощью программы
https://github.com/teepean/BAM-Analysis-KitНа выходе ряд отчетов, некоторые STR маркеры, Mtdna, гаплогруппа (это можно и с помощью wgsextruct) итд. Программе для работы требуется много места, учтите.
Бионформатика оказалась очень интересной темой. Кому интересно, запишитесь на степике на курсы по NGS, очень интересно.