Валера (Val_Metov), хотел спросить, Вы на galaxy вебсайт загружали свои файлы? Там генерацию bam файлов с FASTQ не пробывали сделать?
Вчера загрузил на https://usegalaxy.org/ все данные с Nebula, и запустил по инструкции юзера TK (детали ниже) с разницей map medium reads (>100 bp). Так вот, этот бам весит 66 гигов, а бам с конвертаций с CRAM файла свыше 75гигов весит. Вот думаю в чем разница между ними?
Unmaped reads не сравнивал? Может в меньшем их нет?
Я как раз по этой инструкции локально делаю. В galaxy загрузил, но пока ничего не получилось. Я пытался список адапторов указать, но что-то не проходит. Попробую по инструкции.
Мне интересно сравнить приватные снипы с одним прочтением, которые выявили в Yfull с самостоятельно собранным вариантом.
Кстати, если у вас стоит вопрос обновления ПК, в том числе для работы с NGS файлами, рекомендую присмотреться к очень производительным, по соотношению цена качество сборкам на основе серверных процессоров intel, которыми барыжат китайцы. Самый актуальный вариант 12 ядерный 24 поточный процессор Xeon e5 2678 v3. Все ядра работают на частоте 3,3 ггц. С учетом того, что тот же samtools хорошо задействует все потоки, то это хороший выбор. Большой плюс этого проца - поддержка ddr3 в 4х (даже в 8 есть) канальном режиме. Низкая частота памяти но в 4х каналах дает хорошие результаты. Материнские платы от 60$.
Еще более радикальное решение 2хпроцессорные платы и 2 E5 2678. 48 ядер для таких сложных расчетов будут не лишними. 64 гб DDR3, а можно и 128-256!