Подготовил сравнительную таблицу. Там много столбцов, но самое главное количество прочтений в начале.
Reads это данные с Yfull (из собранного на Minimap2 образца).
DP12 сравнение где Parabricks (BWA mem) больше прочтений стоит 1, где наоборот 2.
P_DP - количество прочтений Parabricks
M_DP - количество прочтений minimap2.
Разница не сильно большая, но в основном bwa mem получше.
vcf готовил через deepvariant. Но не везде данные Yfull совпадают с данными по Minimap2. Когда на Yfull меньше, то это понятно. Отфильтровали итд. А когда наоборот, уже другая история. Некоторые позиции в bam файле deepvariant не идеально считал. Видимо Yfull в ручную перепроверяют приватные снипы.
Все снипы в таблице приватные.
https://docs.google.com/spreadsheets/d/19q9OyyiCegzqA-zltfSJ0FDAacFZDSRINob--zHWMg8/edit#gid=1959360107Довольно быстро собирается
Program: GPU-PBBWA mem, Sorting Phase-I ||
|| Version: 4.2.1-1.beta4 ||
|| Start Time: Sun Feb 11 10:23:18 2024 ||
|| End Time: Sun Feb 11 58 2024 ||
|| Total Time: 69 minutes 40 seconds ||
------------------------------------------------------------------------------
------------------------------------------------------------------------------
|| Parabricks accelerated Genomics Pipeline ||
|| Version 4.2.1-1.beta4 ||
|| Sorting Phase-II ||
------------------------------------------------------------------------------
Sorting and Marking: 70.003 seconds
------------------------------------------------------------------------------
|| Program: Sorting Phase-II ||
|| Version: 4.2.1-1.beta4 ||
|| Start Time: Sun Feb 11 01 2024 ||
|| End Time: Sun Feb 11 11 2024 ||
|| Total Time: 1 minute 10 seconds ||
------------------------------------------------------------------------------
------------------------------------------------------------------------------
|| Parabricks accelerated Genomics Pipeline ||
|| Version 4.2.1-1.beta4 ||
|| Marking Duplicates, BQSR ||
------------------------------------------------------------------------------
Using PBBinBamFile for BAM writing
BQSR and writing final BAM: 190.013 seconds
------------------------------------------------------------------------------
|| Program: Marking Duplicates, BQSR ||
|| Version: 4.2.1-1.beta4 ||
|| Start Time: Sun Feb 11 12 2024 ||
|| End Time: Sun Feb 11 22 2024 ||
|| Total Time: 3 minutes 10 seconds ||
------------------------------------------------------------------------------