A comprehensive mutation study in wide deep-rooted R1b Serbian pedigree: mutation rates and male relative differentiation capacity of 36 Y-STR markersHighlights
•120 male contemporaries (6349 pairs of relatives) related by 1–20 meiosis (overall 485) were genotyped using 36 Y-STRs.
•An average mutation rate was 10.06 × 10−3 (95% CI: 8.65 × 10−3 - 11.61 × 10−3).
•RM13, Yfiler + and PPY23 differentiated 95.9%, 65.5% and 57.4% pairs of relatives.
•Extra-pair paternity rate was 11.9 × 10−3 (95% CI: 4.4 × 10−3 - 25.8 × 10−3).
•A positive correlation between the fathers’ ages and mutability rates was observed.
Abstract
Haplotyping of Y-chromosomal short tandem repeats (Y-STRs) reflects the paternal lineage, although, the father-son pair profiles may differ due to the germline mutations. In order to discriminate between closely related males in criminal cases, as well as for the correct application of Y-STRs in the paternity/kinship analysis and determination of the most recent common ancestor in the familial searching or genealogy research, the assessment of mutation rates of routinely used Y-STRs is of a great importance. We genotyped 120 males belonging to one wide deep-rooted pedigree separated by 1–20 meiosis. The haplotypes of analyzed males distributed over 12 different families (according to their surnames), with 113 originating from one ancestor, and the remaining 7 from the second, closely related to the previous one, belong to the R1b haplogroup. The analysis was performed using Powerplex® Y23 kit, Yfiler™ plus kit and 13 rapidly mutating (RM13) Y-STRs. In 20,855 allele transmissions, 175 mutations (61% repeat losses and 39% gains) and one gene conversion event were found at 25 out of 36 markers. The medians of locus-specific mutation rates estimated using the Bayesian approach ranged from 1.42 × 10−3 (95% credible interval (CI): 0.05 × 10−3 - 7.56 × 10−3) for loci with no observed mutations to 130.91 × 10−3 (95% CI: 102.91 × 10−3 - 162.78 × 10−3) for DYF399S1, with a median rate across all 36 markers of 10.06 × 10−3 (95% CI: 8.65 × 10−3 - 11.61 × 10−3). In 6349 male relative pairs, the 36 Y-STR set distinguished 98.4% relative pairs by at least one mutation, compared to 95.9%, 65.5% and 57.4% for RM13, Yfiler™ plus, and Powerplex® Y23 set, respectively. The extra-pair paternity rate was estimated at 11.9 × 10−3 (95% CI: 4.4 × 10−3 – 25.8 × 10−3) fitting within the range reported for some European populations. A significant positive correlation was observed between fathers’ ages at the time of the Y chromosome transmission and mutability rates (R2 = 0.9495, p = 0.0256), with more significant results when analyzing RM markers (R2 = 0.9827, p = 0.0087).
https://www.fsigenetics.com/article/S1872-4973(18)30675-6/abstractИнтересный комментарий от Игоря Рожанского:
На заре ДНК-генеалогии, преимущественно на англоязычных ресурсах, горячо дебатировался вопрос, корректно ли сопоставлять датировки, полученные при счете по мутациям в STR, если в разных популяциях средняя продолжительность жизни мужчин (в случае Y-хромосомы) и, опосредованно, длина поколения (усредненная по числу сыновей от старшего до младшего) различна. На этот счет кипели нешуточные страсти, в основе которых были имевшиеся в то время данные по статистике мутаций на парах отец-сын. Формально получается, что, если вероятность мутации в том или ином маркере при мелосе не зависит от возраста отца, то среднее количество мутаций, накопленных в течение фиксированного промежутка времени у потомков основателя рода, будет различаться в зависимости от среднего числа поколений, укладывающихся в данный промежуток.
Со временем эти дискуссии сошли на нет, потому что ни доказать, ни опровергнуть тезис о независимости скорости мутаций от возраста отца на экспериментальном материале не удалось. Профессионалы перешли к понятию условного поколения как способа перевода скоростей, полученных при калибровке по календарным годам, и только любители (как правило, малограмотные в буквальном смысле) продолжали разговоры в духе, что, мол, во времена палеолита детей рожали в 15 лет, а потому мутации набегали в 2 раза быстрее, чем сейчас.
С появлением технологии Next Generation Sequencing появилась возможность провести калибровки по снипам в Y-хромосоме, что, среди прочих, проделали с исландцами, располагавшими документальными родословными вплоть по 17-18 веков. Оказалось, что принимаемый ранее без доказательства тезис о независимости вероятности мутации от возраста отца неверен.На статистически достоверном уровне была найдена положительная корреляция. А именно, чем старше отец, тем выше вероятность мутации. Если на пальцах, то родные братья с разницей в возрасте в 20 лет будут (в среднем) по мутациям в Y-хромосоме больше напоминать двоюродных братьев, а младший сын - внука своего родного отца. После этого исследования при калибровках по снипам вообще отказались от понятия средней длины поколения, и константы считают по календарным годам. В формате YFull это в среднем 1 мутация за 144 года, и не имеет значения, сколько поколений уложилось в этот срок.
После этих расчетов почти не оставалось сомнений, что с мутациями в STR происходит то же самое, но не было конкретных данных, чтобы это подтвердить. В этом году они появились. В последнем номере журнала "Forensic Science International. Genetics" группа генетиков-криминалистов из Сербии опубликовала результаты исследования Y-ДНК 120 сербов из гаплогруппы R1b, находившихся в документированном родстве и располагавших сведениями о датах рождения своих предков вплоть до начала 18 века. Вот ссылка на оригинальную работу https://www.fsigenetics.com/article/S1872-4...0675-6/abstract
Авторы калибровали данные в форматах, принятым у криминалистов, но в данном случае это не принципиально, потому что один их основных выводов исследования не должен зависеть от таких частностей. Он звучит так:
A positive correlation between the fathers’ ages and mutability rates was observed (Наблюдается положительная корреляция между возрастом отцов и скоростями мутаций). Как и следовало ожидать, в этом плане мутации в STR ничем не отличаются от мутаций в снипах.
Вот как эта корреляция выглядит "живьем" в виде графика, на котором по оси абсцисс отложен средний возраст отцов в 4-х родственных генеалогических линиях, а по оси ординат - среднее число мутаций, накопившихся у потомков родоначальника каждой из линий.
Можно при желании выискивать "проколы" в методике подсчета и придираться к коэффициентом корреляции, но это все переливание из пустого в порожнее. Работа сербских генетиков ставит точку в вопросе о влиянии длины поколения на датировки, полученные при калибровках Y-STR по календарным годам. Будучи эмпирическим на момент изобретения, это подход теперь получил экспериментальное обоснование. Мутации накапливаются пропорционально календарным годам, что дает возможность говорить о ДНК-генеалогических датировках как очень стабильных и мало подверженных внешним воздействиям.