Поскольку выборка продолжает регулярно обсуждаться, решил создать посвящённую ей отдельную тему.
Насколько мне известно, это первая введённая в широкий оборот выборка этнических русских.
Не позднее 2002 года образцы были анонимно предоставлены
Human Genome Diversity Project для научного использования. Поэтому точно неизвестно, кто, как и где их собирал. Однако приведены примерные координаты: 61 градус северной широты, 40 градусов восточной долготы. Ближайшим к этой точке значимым населённым пунктом является посёлок
Коноша у границы Архангельской и Вологодской областей. По каким-то причинам эту выборку также часто называют каргопольскими или вологодскими русскими.
Периодически высказывается мнение, что выборка искажена и вместо настоящих русских туда помещены представители других народов.
Я решил проверить, может ли это быть действительно так, и поместил образцы на геногеографическую схему:
Голубыми кружками обозначены имеющиеся у меня русские выборки. Красными ромбами - образцы HGDP (25 штук). В порядке слева направо они располагаются так:
HGDP00900, HGDP00890, HGDP00888, HGDP00902, HGDP00883, HGDP00889, HGDP00884, HGDP00887, HGDP00903, HGDP00899, HGDP00880, HGDP00879, HGDP00892, HGDP00891, HGDP00885, HGDP00901, HGDP00881, HGDP00897, HGDP00882, HGDP00895, HGDP00886, HGDP00898, HGDP00896, HGDP00893, HGDP00894
Как и должно быть, центр облачка оказывается непосредственно близок к вологодской, а также ряду других схожих выборок северных русских. В то же время, общий разброс достаточно велик. Образцы HGDP00900 и HGDP00888 отклонились к юго-западу, что может говорить о влиянии из центральных и южных районов страны. С другой стороны, заметная часть образцов отклоняется на восток, сближаясь с выборкой пермских русских. Это заставляет сомневаться, что все образцы представляют местное население из какой-то деревни. Возможно, заметная часть там приезжие.
Вызывает некоторые вопросы сближение с пермскими старожилами. Выборка пермских русских отличается от остальных северян небольшой дополнительной долей связанного с коми и удмуртами компонента. Такой же компонент проявлялся у русских HGDP в моей
старой работе по IBD-анализу жителей Севера. Однако сами коми и удмурты не проживали настолько далеко на запад, как Коноша. Поэтому его нельзя объяснить местным субстратом. С другой стороны, если бы в выборку попали настоящие коми, или люди с родителями-коми, они не оказались бы среди основного русского облачка. Может быть, тут действительно замешаны пермские русские - почему бы их группе не приехать в Коношу на заработки. Сложно сказать.
Как бы то ни было, все образцы расположились в пределах обычных для северных русских значений. Никто из них не сблизился с нерусскими или "экстремально финскими" русскими выборками вроде мезенской. Таким образом, выборка адекватно представляет севернорусский генофонд. Пока она была единственной, можно было говорить, что всех русских выборка не отображает. Однако уже давно введены в научный оборот выборки, представляющие русских из центральных, южных и западных районов страны. Поэтому оснований для претензий к ней не вижу.
Также приведу ссылки на расположение образцов HGDP на дереве YFull:
HGDP00879 Russian https://www.yfull.com/tree/N-YP6094/
HGDP00880 Russian, HGDP00882 Russian https://yfull.com/tree/R-YP1337/
HGDP00883 Russian https://www.yfull.com/tree/N-B181/
HGDP00886 Russian https://yfull.com/tree/R-Y17690/
HGDP00887 Russian (ERR1025605) https://yfull.com/tree/I-Y31845/
HGDP00888 Russian https://yfull.com/tree/R-YP415/
HGDP00890 Russian https://yfull.com/tree/I-PH5383/
HGDP00895 Russian https://yfull.com/tree/I-BY65672/
HGDP00897 Russian https://yfull.com/tree/R-YP351/
HGDP00891 Russian https://www.yfull.com/tree/N-CTS3451/
HGDP00892 Russian https://yfull.com/tree/R-YP416/
HGDP00900 Russian https://yfull.com/tree/R-YP682/
HGDP00893 Russian https://yfull.com/tree/G-Y13381/
HGDP00894 Russian https://yfull.com/tree/I-BY25359/
HGDP00896 Russian https://yfull.com/tree/Q-YP789/