Очень интересная работа. Поясню отличие предиктора, разработанного авторами от ныне известных:
Наиболее популярна группа предикторов, основанная на формуле Байеса. Она классифицирует гаплотипы на некоторое количество гаплогрупп и их субкладов. Это количество строго задано, причем тот факт, что гаплогруппы и субклады ветвятся в этой формуле никак не учитывается. Знаменитый Аттеевский предиктор - именно таков.
Другой подход - учёт ветвления гаплогрупп, типа - классификации по дереву. Он считается более структурным, нежели чисто статистический и может вести классификацию "по уровням". Но используется реже ввиду своей сложности и необходимости обучения по всей структуре дерева гаплогрупп, а не по их фиксированному набору, что сделать проще.
Так вот: подход авторов - попытка "скрестить ужа и ежа". Они одновременно используют и Байесовский подход и дерево. Продвигаются они по дереву используя понятие "энтропии гаплотипов" по отношению к ветвлению гаплогрупп, а не примеряя гаплотип к каждой из исследуемых гаплогрупп, которых у них может быть сколько угодно.
Я не скажу навскидку, насколько такой подход может быть успешен практически, но идея интересная. К сожалению, сам предиктор написан для Линукса, которого у меня нет. Но тем, кто им располагает, я очень рекомендую его испытать и сравнить, скажем, с Аттеем, для уже проснипованных гаплотипов.
Очень интересно, в чью пользу будет сравнение.