Тут смущает вот что - очень похоже, что на 23иЯ разделение по этногруппам идёт так -житель гос-ва Украина, значит Украинец, житель России русский, а резидентов Беларуси в базе нет -значит нет и беларусов(возможно я и ошибаюсь), а вот у Макдональда, похоже, подход несколько иной и мне этот поход как то больше по душе, чем то, что имеется у EuroDNACalc в его нынешнем виде.
Подход в обоих случаях совершенно одинаковый и базируется на одних и тех же источниках.
Более того подход совершенно правильный.
Вкратце обрисую его.
Берётся коренное население какого-нибудь региона отождествляющее себя с каким-нибудь этносом. Тестируется. И принимается в качестве референтного.
По иному никак нельзя. Да и не нужно.
О какой-то
чистоте крови можно говорить на каком-нибудь заброшенном островке Полинезии. Да и то, лет на 600 вглубь.
Речь идёт о преобладающих мотивах. О распределении. Либо гаплогруппном, либо STR-аутосомном, либо сниповом.
То есть берётся к примеру
какой-то регион России, или же
Украины, а в нём тестируются коренные жители, считающие себя русскими, или украинцами. И их-то и мы полагаем русскими и украинцами. Полученные данные используем для дальнейших сравнений. Понятно, что при мизерности выборок и их общем малом числе могут быть разные курьёзы. Скажем, какой-нибудь цыганский табор посаженный на землю. Или какие-нибудь пленые ливонцы, давшие потомство. Или же прозелиты, сменившие конфессию.
Но статистически картина будет отражаться верно. И чем больше выборок, чем более выверенный подбор тестируемых в них - тем точнее.
Процесс это на долгие годы:
Во-первых, само тестирование. Побрызжем немного безудержным оптимизмом. Предположим, что по русским есть 100 выборок. Будем фантазировать дальше. Предположим, что каждая выборка в сотню сэмплов. Итого имеем по одному тестированному на десяток тысяч человек. Не густо? Не правда ли? Действительность находится ещё дальше.
Во-вторых, обеспечение равномерности выборок. То есть отбор неродственников. Пока я не встречал ни одной выборки с проработкой на глубину хотя бы с десяток поколений. Тут я буду первым. И совершенно не волнуюсь, что кто-то в мире (sic!!!) меня опередит. Пусть даже подготовительный архивный этап займет 3-5 лет. К этому времени можно будет сделать более глубокие и точные тесты. Хотя уже сейчас я договорился абсолютно на все существующие виды тестирования (Y-STR по 67 маркерам, HVR1+HVR2, 21 аутосомный маркер, миллионная мультиснип-панель) для 200 человек. Не хотелось бы преждевременно громко испортить воздух, поэтому и работаю над генеалогиями. К тому времени как закончу, возможно реально будет сделать полное сиквенсирование по всем.