Да, меня поразило, что BWA-backtrack неожиданно дал лучшие результаты для сравнительно длинных ридов - 150bp.
Правда, уровень "улучшения" картины по снипам (по сравнению с другими алгоритмами), используемым YFull в осознанной части Y-ДНК я бы оценил лишь в 5-10%.
Но ведь в некоторых случаях и 10% улучшение может означать выявление 1 лишнего снипа из каждых 40 (например), либо перевод его по качеству из удовлетворительного в "отличные"
А как анализировались снипы? Каждый вариант выравнивания загружался на YFull?
Не, делал всё просто - куча выравниваний загружались одновременно в IGV и выборочно (примерно по 30 снипам конечного уровня и уровней чуть выше) вручную смотрелась картина как самих снипов, так и их окрестностей.
Достаточно наглядно было, когда при одном выравнивании в позицию попадало 14T и 1C, а при другом - оставались только ровно 14T (ну и аналогичные картины).
Что касается "окрестностей" снипов - также, в некоторых случаях в недалеком отдалении от снипов (2-50 тыс. позиций) наблюдались "зубья пилы" (как будто в этом месте было не 30x, а 300x) - причём периодически такие артефакты повторялись (периодичность повтора заставляла задуматься о проблемах алгоритма, который, скажем, "собирал" каждые 50 тыс. позиций немаппированные куски в один блок и вываливал их не думая в одно место).
Для расчётов использовал весьма мощные сервера (в каждом по 4 Xeon с кучей памяти) и фактически за несколько дней прокрутил много вариантов.
Увы, делал в достаточной степени бессистемно (ну, то есть чтобы побаловаться) - встречал где-нить референс, скачивал и сразу запускал "на посмотреть" (аналогично для алгоритмов выравнивания).