АвторТема: FASTQ->BAM  (Прочитано 4294 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Val_Metov

  • Сообщений: 1240
  • Страна: ru
  • Рейтинг +912/-2
  • Y-ДНК: J-Y94477
Re: FASTQ->BAM
« Ответ #60 : 10 Февраль 2024, 23:33:50 »
В parabricks оказывается есть поддержка minimap2. Но как я понял поддерживается только сборка длинных ридов.

Взял 24гб видеокарту. Потренироваться на LLM модель (типа локальный chatGPT). Ну и попробовал parabricks. Довольно быстро собирает на BWA GPU. 16 gb Vram задействует.

Оффлайн wave48

  • Сообщений: 262
  • Страна: ru
  • Рейтинг +57/-8
  • Y-ДНК: N1c1-L550
  • мтДНК: U5b2a1a2
Re: FASTQ->BAM
« Ответ #61 : 11 Февраль 2024, 00:04:45 »
В parabricks оказывается есть поддержка minimap2. Но как я понял поддерживается только сборка длинных ридов.

Взял 24гб видеокарту. Потренироваться на LLM модель (типа локальный chatGPT). Ну и попробовал parabricks. Довольно быстро собирает на BWA GPU. 16 gb Vram задействует.
Я тоже так хо...

Оффлайн Val_Metov

  • Сообщений: 1240
  • Страна: ru
  • Рейтинг +912/-2
  • Y-ДНК: J-Y94477
Re: FASTQ->BAM
« Ответ #62 : 11 Февраль 2024, 13:10:59 »
Подготовил сравнительную таблицу. Там много столбцов, но самое главное количество прочтений в начале.
Reads это данные с Yfull (из собранного на Minimap2 образца).
DP12 сравнение где Parabricks (BWA mem) больше прочтений стоит 1, где наоборот 2.
P_DP - количество прочтений Parabricks
M_DP - количество прочтений minimap2.

Разница не сильно большая, но в основном bwa mem получше.
vcf готовил через deepvariant. Но не везде данные Yfull совпадают с данными по Minimap2. Когда на Yfull меньше, то это понятно. Отфильтровали итд. А когда наоборот, уже другая история. Некоторые позиции в bam файле deepvariant не идеально считал. Видимо Yfull в ручную перепроверяют приватные снипы.

Все снипы в таблице приватные.

https://docs.google.com/spreadsheets/d/19q9OyyiCegzqA-zltfSJ0FDAacFZDSRINob--zHWMg8/edit#gid=1959360107

Довольно быстро собирается

Program:                    GPU-PBBWA mem, Sorting Phase-I        ||
 ||        Version:                                     4.2.1-1.beta4        ||
 ||        Start Time:                       Sun Feb 11 10:23:18 2024        ||
 ||        End Time:                         Sun Feb 11 58 2024        ||
 ||        Total Time:                          69 minutes 40 seconds        ||
 ------------------------------------------------------------------------------
 ------------------------------------------------------------------------------
 ||                 Parabricks accelerated Genomics Pipeline                 ||
 ||                           Version 4.2.1-1.beta4                          ||
 ||                             Sorting Phase-II                             ||
 ------------------------------------------------------------------------------
 Sorting and Marking: 70.003 seconds
 ------------------------------------------------------------------------------
 ||        Program:                                  Sorting Phase-II        ||
 ||        Version:                                     4.2.1-1.beta4        ||
 ||        Start Time:                       Sun Feb 11 01 2024        ||
 ||        End Time:                         Sun Feb 11 11 2024        ||
 ||        Total Time:                            1 minute 10 seconds        ||
 ------------------------------------------------------------------------------
 ------------------------------------------------------------------------------
 ||                 Parabricks accelerated Genomics Pipeline                 ||
 ||                           Version 4.2.1-1.beta4                          ||
 ||                         Marking Duplicates, BQSR                         ||
 ------------------------------------------------------------------------------
 Using PBBinBamFile for BAM writing
 BQSR and writing final BAM:  190.013 seconds
 ------------------------------------------------------------------------------
 ||        Program:                          Marking Duplicates, BQSR        ||
 ||        Version:                                     4.2.1-1.beta4        ||
 ||        Start Time:                       Sun Feb 11 12 2024        ||
 ||        End Time:                         Sun Feb 11 22 2024        ||
 ||        Total Time:                           3 minutes 10 seconds        ||
 ------------------------------------------------------------------------------
« Последнее редактирование: 11 Февраль 2024, 15:37:31 от Val_Metov »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.