Легко сказать=)
Я так понимаю, для создания данного калькулятора нужно определить "паттерны" участков генома, четко идентифицирующих представителей одной популяции и отделяющих их от других групп. Понятно, что некоторые "регионы" этих "паттернов" могут оказаться общими у совершенно никак не связанных между собой популяций, в силу чистой случайности, но вряд ли процент шума будет сильно высок, по крайней мере настолько, чтобы заметно повлиять на результат, да и с ростом выборок можно будет отсеивать подобные артефакты. Вероятно, для разных "регионов" будет разная вероятность принадлежности к "генетической подписи" популяции, например: у 10 йоруба может быть 6 участков, общих для всех и 2 общих только для 4 из них - с бОльшим размером выборок увеличится и стабильность "карт сегментов", но, имхо, тут важны не столько размеры отдельных сегментов и их общая длина, а именно "паттерны", т.е. характерное расположение общих сегментов (оптимальный размер которых, видимо, будет определяться эксперементальным путем) в геноме для представителей определенной группы - ведь для близких популяций будет много общих сегментов, однако должны быть и характерные замены в определенных регионах генома для конкретных популяций, если они, конечно, являются таковыми, так, если у американца, преимущественно, скадинавского происхождения, с соответствующим фенотипом, в определенных регионах генома будут присутствовать вставки участков, характерные для геномов тех же йоруба, то это может свидетельствовать об адмиксе, причем вероятность адмикса будет тем выше, чем больше участков будет приходиться на регион генома, где чаще всего встречаются участки характерные именно для йоруба, т.е. так, отчасти, можно отфильтровать случайное сходство - это все касается выявления, насколько это возможно, незначительных следов адмикса. Что же до определения времени для события адмикса, то здесь, вероятно, нужно смотреть на процент общих сегментов от всего генома: 50% - одно поколение назад, 25% - 2 и т.д. на какой глубине можно будет фиксировать след единичной примеси (= один предок) - сложно сказать, думаю 4, максимум 5, поколений назад, при обширной выборке и откалиброванных иструментах?
это, имхо, уйма работы=) хотя, подозреваю, что-то подобное предлагает Поляко:
- advanced users of third party ancestry tools can request a more detailed analysis of a specific issue, such as confirming minor Sub-Saharan or Ashkenazi admixture.
но что сей сервис из себя представляет я не знаю, надо бы дождаться отзывов)
ну и в утилите countries of ancestry от 23ия такое есть.