Прошелся по проектам FTDNA и обратил внимание на то, что соотношение количества BigY и STR-тестов 12/37/67/111 почти не изменилось за прошедшие 5 лет - основной массе по-прежнему интереснее охват вширь, а не вглубь: полагаю, что в странах, где генеалогия популярнее, чем в СНГ, достаточно легко найти совпаденца по 67 STR, списаться с ним, а затем найти точку пересечения по документам, не прибегая к дорогим тестам.
В то же время, количество лабораторий, делающих WGS, продолжает расти (при заказе интерпретации YFull, доступен выбор из 12 шт.), как и количество образцов в YFull, загруженных из таких лабораторий. Например, моя веточка R-FT92022 это 30 образцов FTDNA, 10 образцов Nebula, 4 образца Dante, 0 образцов YSEQ. Соседняя R-YP343 имеет соотношение 61/17/4/3, а R-CTS3402 - 52/20/8/5. Т.е. доля FTDNA местами снижается до 60%.
Это натолкнуло меня на мысль, что YFull не только является стандартом де-факто в плане топологии Y-SNP, но и становится связующим центром для STR, полученных со всех этих лабораторий. А вот STR-формат YFull успехом не пользуется - инструменты сообщества, вроде того же Nevgen и MyMcGee, его не поддерживают. Соответственно, нужен инструмент, который:
1) сможет превращать неполную панель STR, извлеченных из WGS, в полную 111-маркерную;
2) сможет приводить ее в формат FTDNA, являющийся стандартом де-факто.
В таком случае, человек, сделавший себе WGS и загрузившийся в YFull, не будет нуждаться в дублирующем STR-тесте от FTDNA для того, чтобы сравниться с образцами из открытых проектов FTDNA и построить STR-древо. Недоступны будут только образцы из приватных проектов и образцы людей, не вступивших в проекты.
По этой причине, я очистил yImputer от всего лишнего, сконцентрировавшись на решении этих проблем. Результат разместил в Я.Облаке и прикрутил суровую веб-морду:
https://daemon2017.github.io/yImputer/Как пользоваться:
Открываем проект и копируем интересующие STRы вместе с "x" на месте отсутствующих значений и табуляциями в качестве разделителя:
13.c 25 16 10 12 13 12 x 10 12 11 28 15 9 10 11 11 24 14 20 33 13 15 16 16 11 10 19 23 15 16 18 20 x x 13 11 11 8 17 17 8 12 10 8 9 10 12 20 22 15 10 12 12 14 8 13 23 21 12 12 11 13 11 11 12 13 32 15 9 15 x 25 x 19 x 12 12 x 10 x 12 11 10 x 11 31 12 13 24 13 10 10 18 15 19 11 22 14 14 15 24 12 23 19 10 15 17 9 11 11
Вставляем в верхнее поле сайта и жмем Impute:
Через 5-10 секунд получаем 111-маркерный гаплотип в формате FTDNA, который можно использовать в MyMcGee, yMurmur и пр. инструментах для STR-анализа:
13 25 16 10 12-13 12 13 10 12 11 28 15 9-10 11 11 24 14 20 33 13-15-16-16 11 10 19-23 15 16 18 20 33-36 13 11 11 8 17-17 8 12 10 8 9 10 12 20-22 15 10 12 12 14 8 13 23 21 12 12 11 13 11 11 12 13 32 15 9 15 12 25 27 19 12 12 12 12 10 9 12 11 10 11 11 31 12 13 24 13 10 10 18 15 19 11 22 14 14 15 24 12 23 19 10 15 17 9 11 11
Для сравнения, вот STR для этого же образца, полученные тестом Y111 от FTDNA:
13 25 16 10 12-13 12 13 10 12 11 28 15 9-10 11 11 24 14 20 33 13-15-16-16 11 10 19-23 15 16 18 20 33-36 13 11 11 8 17-17 8 12 10 8 9 10 12 20-22 15 10 12 12 14 8 13 23 21 12 12 11 13 11 11 12 13 32 15 9 15 12 25 27 19 12 12 12 12 10 9 12 11 10 11 11 31 12 13 24 13 9 10 18 15 19 11 22 14 14 15 24 12 23 19 10 15 17 9 11 11
Из 9 выпавших, отличается 1 маркер на 1 шаг.
Учитывая то, что YFull дает точные сведения об SNP, можно использовать еще и их для более точного определения STR'ов.