Если очень коротко и упрощенно, то гомология = похожесть. В данном контексте под гомологией понимается похожесть последовательностей нуклеотидов. Общепринято считать критерием качества что у участка со снипом на Y хромосоме не будет найдено копий на Y хромосоме или на других хромосомах, которые будут похоже более чем на 95%. Участок для поиска похожести принято брать длиной 1000 нуклеотидов (500 влево и 500 вправо от снипа).
Для примера, две следующих последовательности в 60 нуклеотидов полностью идентичны, то есть похожесть 100%:
TTTCTTTGAGGTCTTGTTAAGTAGGACCTTAGCAGCCTCGGCCTAGATCTAATCTTCCAC
TTTCTTTGAGGTCTTGTTAAGTAGGACCTTAGCAGCCTCGGCCTAGATCTAATCTTCCAC
В примере ниже похожесть равна 98.33%, не совпадает 1 символ из 60.
ATTGAGCTATGTTCTAAGATG
CAGTTAAATTATCTGGAAAGATTTTGGTTCTTTGAGGGT
ATTGAGCTATGTTCTAAGATG
TAGTTAAATTATCTGGAAAGATTTTGGTTCTTTGAGGGT
Чем опасна гомология? К примеру в тестах NGS (Big Y и тп). Во время
выравнивания последовательностей программа может по некоторым причинам поместить одну похожую последовательность на место другой. Чем короче последовательность тем вероятнее такой вариант. В результате мы получим несуществующий в реальности SNP. Посмотрите на мой второй пример. Если поместить вторую последовательность на место первой, то получим SNP с мутацией C->T, но на самом деле этого SNP не существует, это всего лишь ошибка программы выравнивания из-за несовершенства технологий.
Это не значит что все снипы на гомологичных участках плохие - просто к ним надо относиться с осторожностью. В YFull показаны приватные снипы, которые имеют высокую степень гомологии - они отмечены красной литерой "H". Такой приватный снип скорее всего не будет принят в YSEQ, да и при включении его в SNP pack в FTDNA будет давать неправильные результаты - примеров множество. В дерево обычно такие SNP не включаются, но есть и некоторые исключения. Как я говорил выше, BY29708 неплохо определяется в bam'e, хотя и имеет высокую гомологию. Мы его включили в следующую версию дерева, но если с ним будут проблемы, то в дальнейшем он будет удален.