Хотел сделать отдельную тему, но раз уж есть эта, то дополню расчётом и результатами симуляции. В своё время пытался разобраться с тем, как работает поиск совпадений среди современных людей и дДНК. Получилось такое:
Терминология
- Сегмент - это непрерывающийся блок хромосомы, перешедший неизменным от интересующего нас предка из поколения N (N=1 для родителей, N=2 для дедов-бабушек и т.д.) При этом изначально ДНК уже разбито на сегменты - хромосомы (т.е. по сути геном это уже 47 сегментов = 23 * 2 + мтДНК)
- Кроссовер - обмен сегментами между каждой парой хромосом при образовании половых клеток. Например, из двух версий хромосомы 5, генетический код которых мы условно запишем как 1111111 и 2222222 получается что-то вроде 1222111 и 2111222, которые попадают в две разные гаплоидные половые клетки. Может получатся что-то вроде 1112222 и 2221111. Часто короткие хромосомы могут вообще не рекомбинировать (особенно у мужчин).
- Спайка - место соединения двух блоков (сегментов) хромосом при кроссовере. В первом примере выше в каждой хромосоме из пары появилось две "спайки" где "1" меняется на "2", и наоборот. Во втором примере - одна спайка.
Использованная модель очень примерная и теоретическая
- Во-первых, места образований новых “спаек” при кроссовере не равновероятно - например спайки появляются реже в регионах хромосом, кодирующих важные гены. Хотя, это мы сможем по большей части обойти, если будем оперировать сантиморганами (сМ), поскольку в них уже "зашита" вероятность рекомбинации.
- Во-вторых, в нашей упрощенной все хромосомы одинаковы (хотя например Y и “хромосома” мтДНК не делятся).
- В-третьих, мы не будем учитывать то, что с увеличением древности поколений одни и те же люди (предки) всё чаще начнут появляться в разных местах дерева, т.е. реальное количество предков будет меньше, чем теоретическое. Колонки, отмеченные звёздочкой (*) - это теоретические значения, не учитывающие это частичное “схлопывание” генеалогического древа.
Кроссовер происходит неравномерно у мужчин и женщин. В разных статьях данные немного разнятся, но в среднем можно сказать, что у мужчин происходит 26 “спаек”, а у женщин 45 “спаек” на весь геном. Каждая “спайка” образует новый “сегмент”. Т.е. в ДНК ребёнка в среднем появляется 71 новый сегмент. Соответственно, если мы рассмотрим два поколения - родителей и их ребёнка, то ребёнок будет иметь 47 + 71 = 118 сегментов.
Аналогично, если мы перемещаемся на одно поколение дальше - сравниваем внуков и бабушек-дедушек, то внук будет иметь 118 + 71 = 189 сегментов.

Видно одно драматическое свойство - что начиная с 7-8 поколения происходит сильное расхождение двух последовательностей чисел - количества сегментов в ДНК (линейный рост) и общего количества предков (геометрическая прогрессия). В теоретической модели, где мы считаем всех предков уникальными, примерно с
12-13 поколения
больше 90% предков уже не вносят никакого вклада в геном потомка. В
15-м поколении (примерно
420 лет) вклад в ДНК вносит только
около 3% предков.
Усреднённый размер сегментов в ДНК на таком временном расстоянии (
15 поколений) по теоретической модели будет около
6,6 сМ.
Если продолжить расчёт вглубь тысячелетий на
1,5 тыс. поколений, то размер сегмента уменьшается до
0,07 сМ - это примерный размер общих сегментов, которые могут быть у некоторых популяций современных людей от Неандертальцев, Денисовцев или древних современных людей типа человека из Усть-Ишима (возраст ок. 45 тыс. лет).
Теоретические данные были проверены с помощью симулятора Ped-Sim (
https://github.com/williamslab/ped-sim) с использованием реальной карты человеческого генома (чтобы учесть разную вероятность возникновения спаек в разных местах хромосом).
Средняя длина общего сегмента для 15 поколений по результатам 100 тыс. симуляций, усреднённое по 22 аутосомам, получилось равным
6,87 сМ (довольно близко к теоретическому 6,65 сМ).
Что интересно, в отдельных единичных случаях через 15 поколений неизменёнными передавались большие блоки хромосом - самый большой 78 сМ, так же встречался 63 сМ.
Всего около
2.9% виртуальных предков “смогли” передать свой геном через 15 поколений. Примерно
1,1% предков передали сегменты длиннее
7 сМ.