Нет, все равно непонятно. Это каков же должен быть объем статистического материала (выборки)? Если есть (допустим) 37 маркеров и по каждому (пусть для простоты) 2 наиболее распространенных значения, так это же получается 2^37 гаплотипов. Разве реально такое удержать в голове или "надергать" откуда-то?
Ладно, давайте зайдем с другой стороны. Гаплогруппа ведь определяется по снипам, да? А между гаплотипом и снипами нет (неизвестно) четкой взаимосвязи? Значит эти предикторы - это просто нейронные сети, обученные на каких-то выборках. Бывает ведь, что различные предикторы дают различные предсказания? Тогда получается надо пользоваться тем предиктором, который обучен на наиболее обширной и разнообразной выборке.
Вопрос изначально был вот в чем. У любого из здешних уважаемых специалистов в голове есть свой собственный предиктор, алгоритм, по которому этот специалист, увидев гаплотип, говорит фразу типа: "у вас, очевидно, гаплогруппа AAA". Вот об этих алгоритмах я и спрашивал. Или это ноу-хау, которым не делятся?