АвторТема: Аутосомные тесты дальних родственников: статистика  (Прочитано 560 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн AVBazАвтор темы

  • Сообщений: 170
  • Страна: ru
  • Рейтинг +123/-0
  • Y-ДНК: R1a-Y35 (YP582+, YP1079+)
  • Y-ДНК: R1a-YP582
Предыстория: в 2024г. на сайте Генотек попался аутосомный совпаденец для двоюродной сестры моего деда с общей длиной фрагмента 9сМ. Я знаю этого человка с 2007г. Познакомился, изучая общую редкую фамилию, присутствующую в наших родословных. Гипотеза о возможном родстве присутствовала всегда, но документально её проверить пока не получилось (в т.ч. по причине отсутсвия документов по предполагаемой деревне проживания предполагаемых родственников). После загрузки результатов совпаденца Гедмач я увидел, что с ним имеется значительное количество небольших совпадающих сегментов: 33 длиной более 3сМ и 5 длиной более 5сМ. Сравнил также пару образцов, у которых заведомо не предполагается родство (предки из разных регионов России) и обнаружил лишь 1 совпадающий сегмент длиной более 3сМ и 1 совпадающий сегмент длиной более 5сМ. Появился вопрос:
Можно ли по аутосомному тесту оличить дальних родственников от "этнофона"? Статья, ссылка на которую приведена в этом сообщении, даёт надежду, что это можно сделать. В частности, приведён график, который показывает некоторые закономерности:


Предлагается в этой теме аккумулировать информацию об аутосомных совпадениях дальних родственников (5-юродных и более далёких). Информацию можно публиковать в таком виде:
1) документальная степень родства;
2) число совпадающих сегментов длиной более 3 сМ и их общая длина;
3) число совпадающих сегментов длиной более 5 сМ и их общая длина;
4) длина наибольшего совпадающего сегмента;
5) комментарий (регион проживания, национальность и другие существенные обстоятельства);
6) (опционально) номера образцов на сайте https://www.gedmatch.com/

Сравнивать образцы предполагается с помощью инструмента "One-to-one Autosomal DNA Comparison" на сайте GedMatch. При формировании отчёта нужно задавать параметр "Minimum segment cM size to be included in total" равным 3сМ и 5сМ соответственно.
« Последнее редактирование: 04 Март 2024, 09:24:37 от AVBaz »

Оффлайн Srkz

  • Сообщений: 8462
  • Страна: ru
  • Рейтинг +4812/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
После загрузки результатов совпаденца Гедмач я увидел, что с ним имеется значительное количество небольших совпадающих сегментов: 33 длиной более 3сМ и 5 длиной более 5сМ. Сравнил также пару образцов, у которых заведомо не предполагается родство (предки из разных регионов России) и обнаружил лишь 1 совпадающий сегмент длиной более 3сМ и 1 совпадающий сегмент длиной более 5сМ.
Ну это вообще не так работает, что у "реальных" родственников будет множество мелких сегментов, а этнофон это пара-тройка мелких сегментов. 33 сегмента 3-5 сМ это в любом случае фон. Математически невозможно, чтобы у вашего кузена 4-6 юродности сохранилась куча недавних сегментов, но просто они все вот так уменьшились. Может, конечно, это такой локальный фон деревни, и в этом смысле можно говорить о родстве. Или просто в первой паре такой набор чипов, который даёт много микросегментов при сравнении, а во второй паре другой набор.

upd глянул статью, приведённые графики это решение противоположной задачи - рассчитать распределение у людей, смоделированных заведомыми родственниками. На вопрос, как отделить оттуда фоновые сегменты, оно не отвечает.
« Последнее редактирование: 04 Март 2024, 09:31:52 от Srkz »

Оффлайн AVBazАвтор темы

  • Сообщений: 170
  • Страна: ru
  • Рейтинг +123/-0
  • Y-ДНК: R1a-Y35 (YP582+, YP1079+)
  • Y-ДНК: R1a-YP582
Srkz, хотелось бы всё-таки посмотреть на реальных примерах какая картина получается у 5-9 юродных. Я думаю, что многим форумчанам это было бы интересно. Другое дело, что не у многих есть такие данные. Прошу поделиться.

Оффлайн Farroukh

  • Maternal Y-DNA: R1b-BY124371
  • ...
  • Сообщений: 17098
  • Страна: az
  • Рейтинг +5909/-17
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Цитировать
на реальных примерах какая картина получается у 5-9 юродных.
Аутосомный тест может более-менее достоверно выявлять как раз до 5-юродных (общий пра(3)дед). Свыше этого начинается общеэтническая мешанина. Всё становится сложнее, когда речь об эндогамной деревне с кучей далёких общих предков и мизерными вкладами от каждого. Разделять иногда удаётся с привлечением иксов, игреков и мито.

Оффлайн Srkz

  • Сообщений: 8462
  • Страна: ru
  • Рейтинг +4812/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Srkz, хотелось бы всё-таки посмотреть на реальных примерах какая картина получается у 5-9 юродных. Я думаю, что многим форумчанам это было бы интересно. Другое дело, что не у многих есть такие данные. Прошу поделиться.
Ну например, в статье по вашей ссылке написано так:
For the European sample, just one or two shared segments totaling less than 15 cM in length yield a median relationship of 5th cousin (Figure 4E).
То есть, для обычных европейцев, не ашкеназов, при 6-юродном (пятый кузен) родстве максимально набирается один-два "реальных", то есть полученных от того самого общего предка, сегмента не более 15 сМ общей длины. Всё остальное это полученный от иных общих предков фон. И скажу более, математически чаще всего у 6-юродных и этого одного сегмента не будет, только фоновые. upd немного поправлюсь, по самой статье один-два сегмента это наиболее типичный, а не максимальный результат. Тут они более оптимистичны, чем другие авторы, у которых типичным результатом будет от нуля до одного сегмента. Но итог это особо не меняет.

И вот как на реальной статистике отличать тот самый "настоящий" сегмент от фоновых? По какому признаку? Темы по сбору статистики ранее уже открывались, но всё упирается в этот вопрос :)
« Последнее редактирование: 04 Март 2024, 10:11:31 от Srkz »

Оффлайн AVBazАвтор темы

  • Сообщений: 170
  • Страна: ru
  • Рейтинг +123/-0
  • Y-ДНК: R1a-Y35 (YP582+, YP1079+)
  • Y-ДНК: R1a-YP582
Srkz, хотелось бы всё-таки посмотреть на реальных примерах какая картина получается у 5-9 юродных. Я думаю, что многим форумчанам это было бы интересно. Другое дело, что не у многих есть такие данные. Прошу поделиться.
Ну например, в статье по вашей ссылке написано так:
For the European sample, just one or two shared segments totaling less than 15 cM in length yield a median relationship of 5th cousin (Figure 4E).
То есть, для обычных европейцев, не ашкеназов, при 6-юродном (пятый кузен) родстве максимально набирается один-два "реальных", то есть полученных от того самого общего предка, сегмента не более 15 сМ общей длины. Всё остальное это полученный от иных общих предков фон. И скажу более, математически чаще всего у 6-юродных и этого одного сегмента не будет, только фоновые. upd немного поправлюсь, по самой статье один-два сегмента это наиболее типичный, а не максимальный результат. Тут они более оптимистичны, чем другие авторы, у которых типичным результатом будет от нуля до одного сегмента. Но итог это особо не меняет.

И вот как на реальной статистике отличать тот самый "настоящий" сегмент от фоновых? По какому признаку? Темы по сбору статистики ранее уже открывались, но всё упирается в этот вопрос :)
Значит у настоящих родственников будет на 1-2 сегмента больше относительно фона - вот так и отличим :)
На самом деле интересно какова будет картина, если учитывать фрагменты длиной не >=10cМ, а длиной 3>=cM. Там, возможно, у настоящих родственников будет, например, на 5-10 сегментов больше сегментов среднефонового значения. Или вы в силу каких-то причн (например, математических моделей) исключаете такой результат?

Цитировать
Темы по сбору статистики ранее уже открывались
Можно с ними ознакомиться? Не могли бы привести ссылки?

Оффлайн Srkz

  • Сообщений: 8462
  • Страна: ru
  • Рейтинг +4812/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
0-1-(2-3) расчётных не-фоновых общих сегментов между шестиюродными - это, по-моему, вообще любых сегментов. Хоть 3-5 сМ, хоть измеренных путём полногеномного тестирования, хоть ещё каких.

Что касается статистики,
1) Сбор статистики
2) расчёт количества сегментов
3) FAQ по определению уровня родства

Ещё где-то есть тема Фарруха, и в отдельных темах были треды со статистикой, но ссылок не сохранил.

Оффлайн Mc-simov

  • GuslitsaDNA
  • Сообщений: 62
  • Страна: ru
  • Рейтинг +32/-0
  • Y-ДНК: R1a-CTS3402-BY32477
  • мтДНК: H6a1a4
Добрый день!
У меня с моей 4-юродной сестрой 86сМ. С её дочерью 65сМ. Тут родство достаточно просто прослеживается.
При этом у участников моего проекта есть (почти у всех) один и тот же совпаденец на FTDNA с величиной совпадений от 40 до 100сМ. Oscar Olmos. Отследить родство с ним (даже гипотетическое) никак не получается.
На сколько я помню, на GEDmatch вообще не рекомендуется опускать настройки меньше 6сМ, т.к. при этом появляется чрезмерное количество ложноположительных совпадений.
Отследить родство с гипотетическим 7-юродным братом, конечно, документально можно. Только вот где гарантия, что имеющееся совпадение в 7сМ идёт именно от этого общего предка? По сути, чтобы решить эту проблемму нужны два дальних родственника, которым известны все свои предки на семь поколений. Я таких людей, к сожалению, не знаю...

Оффлайн Srkz

  • Сообщений: 8462
  • Страна: ru
  • Рейтинг +4812/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Только вот где гарантия, что имеющееся совпадение в 7сМ идёт именно от этого общего предка? По сути, чтобы решить эту проблемму нужны два дальних родственника, которым известны все свои предки на семь поколений. Я таких людей, к сожалению, не знаю...
А нахождение таких родственников тоже не даст гарантии, что сегмент не от какого-то другого предка 8, 9, ... N поколений назад, увы :-\

Оффлайн sommer

  • Сообщений: 665
  • Страна: ru
  • Рейтинг +186/-2
  • Y-ДНК: R-YP4444
Я лично на 60-70 сМ родственных пересечений не находил ни по одному случаю. Хотя я ни финн и не ашкеназ, у которых вроде бы много перекрестных совпадений неродственного характера. И кстати почти половина этих совпадений финны. :) Другая треть американцы, то есть неизвестно кто. Потом немцы, но тоже непонятные.

Оффлайн Mc-simov

  • GuslitsaDNA
  • Сообщений: 62
  • Страна: ru
  • Рейтинг +32/-0
  • Y-ДНК: R1a-CTS3402-BY32477
  • мтДНК: H6a1a4
Да, кстати, есть у меня пример родства уровня "дядя > 6-юродные племянник и племянница". Так вот, на таком уровне выходит 10 и 30сМ.

Оффлайн Medver

  • Сообщений: 1
  • Страна: ru
  • Рейтинг +2/-0
  • Y-ДНК: R1a-Z92
Провёл несколько сравнений имеющихся у меня китов (все тесты были сделаны в генотек, сравнивал в гедматч)

1. Сравнение меня и моего документально подтверждённого 5юродного брата: Наибольший сегмент 20.6. Общих сегментов 29, сумма сегментов 124,5.
1.1 Сравнение меня и сына документально подтверждённого 5юродного брата (мой 5юродный племянник): Наибольший сегмент 5,5. Общих сегментов 25, сумма сегментов 91,1.
2. Сравнение меня и человека из моего села. По этому селу до начала 1800-х годов хорошо проработано оба древо во все стороны, правда есть пара пробелов. Исхожу из предположения, что общих прямых предков между нами с самого начала 19 века не имелось.  Наибольший сегмент 7,2. Общих сегментов 34, сумма - 131,1.
3. Сравнение меня и ещё одного человек из моего села. Древо этого человека не знаю (но с фамилиями которые она исследует у меня нет пересечений). Наибольший сегмент 5,5. Общих сегментов 35, сумма - 126,4.
4. Сравнение меня и нескольких случайных человек из чата по генеалогии моего региона.
случайный образец 1: Наиб сегмент 6,2. Общих сегментов 26, сумма 101,7
случайный образец 2: Наиб сегмент 6,2. Общих сегментов 32, сумма 122,8
случайный образец 3: Наиб сегмент 6,9. Общих сегментов 26, сумма 103,1

По всем образцам длина почти всех сегментов 3-5. Только около трёх сегментов имеют длину больше 5 в каждом из сравнений.

Оффлайн AVBazАвтор темы

  • Сообщений: 170
  • Страна: ru
  • Рейтинг +123/-0
  • Y-ДНК: R1a-Y35 (YP582+, YP1079+)
  • Y-ДНК: R1a-YP582
Srkz, спасибо за полезные ссылки. Особенно понравилось вот это сообщение: https://forum.molgen.org/index.php/topic,6269.msg533248.html#msg533248
Оно вдохновило меня сделать в Excel собственную модель наследования. Взял 22 хромосомы с 1000 условных едениц наследования в каждой (можно интерпретировать как неделимый фрагмент ДНК) и в одном случае принял, что при наследовании применяется 1 кроссовер (условно мужская модель наследования), а в другом случае рассмотрел вариант, когда на одной хромосоме применяется 2 кроссовера (условно женская модель наследования).
В результате такого грубого моделирования (но качественно, я надеюсь, более-менее корректного) вижу, что на девятом поколении в ~60%
 вообще не остаётся исходного генетического материала. В случаях, когда материал остаётся, то он состоит из 1 или реже 2 фрагментов, средняя суммарная длина которых 86 у.е. (порядка 14,5 сМ). (В лучшем случае длина фрагментов составила 253 у.е. (порядка 42,5 сМ), в худшем 3 у.е. (0,5сМ)). Было запущено 30 реализаций условно женской модели наследования. Можно было автоматизировать процесс и сделать большее количество реализаций, но качественно картина понятна. Причём я рассмотрел лишь процесс прямого наследования: от предка к потомку в 9 колене. Но когда мы говорим о 9-юродных братьях, то имеет место быть два таких независимых процесса наследования от их общего предка. Каждный из потомков имеет шанс получить от общего предка фрагмент ДНК (или 2 фрагмента), но почти наверняка эти фрагменты у них будут находиться в разных хромосомах, или в разных частях одной хромосомы. Поэтому совпадение между ними имеет вероятность, близкую к нулю.

Таким образом понятно, что наличие далёкого родства (по одной линии) не имеет ничего общего с обилием мелких общих сегментов. Реальное родство для дальних родственников в самом лучшем случае может быть причиной 1 или 2 совпадающих сегментов. Большое количество небольших сегментов - это этнофон, наследуемый "совпаденцами" от своих родителей.

Medver, спасибо за реальные примеры! Хорошо видно, что если пятиюродного брата ещё удаётся "засечь" благодаря сегменту в 20сМ, то его сын уже неотличим от тех пар образцов, которые неродственны друг другу, но происходят из одной местности.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.