Мне кажется, что нужна общая тема по всему, что связано с WGS. Данте, Небула, YSEQ, научники. Сборка, пересборка есть отдельная тема. Какие есть инструменты. Сервисы заточенные на полногеномные данные а не обрезку из них итд.
Самый основной инструмент для работы с WGS файлами - всем известный проект WGSEXTRACT.
основные возможности:
- Выделение аутосомов в разных форматах из Bam (Cram);
- сборка генома на любой референс;
- обратный процесс перевода bam в fastq;
- конвертация bam в cram (для экономии места) и наоборот;
- оценка качества, метрики разные;
- выделение из bam (cram) Y и Мито (для Yfull) и не только.
итд.
Лично я все Bam перевожу в cram для долговременного хранения. В будущем можно опять пересобрать на любой референс.