АвторТема: The Relationship between HIRs and Relationship  (Прочитано 3535 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
The Relationship between HIRs and Relationship
« : 01 Сентябрь 2010, 16:24:35 »
Из эмпирических наблюдений J.Kenney


Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Re: The Relationship between HIRs and Relationship
« Ответ #1 : 01 Сентябрь 2010, 16:36:53 »
Это подтверждает мои раннее высказанные соображения о том, что между генетической дистанцией и генеалогическим предиктом степени родства (для степеней родств далее, чем четвероюродное) существует рассхождение, приближающиеся к фактору, равному 1.5-1.8.

На практике это означает, что можно смело брать нижний порог предикта (например, в случае с предиктом 4th-10th cousins -берем 10th) и затем умножаем на 1.5 -1.8, получая тем самым более достоверный предикт родства (15-18 поколений).

Последняя часть слайда неверна, так как Энн Тернер совершенно обосновано указала, что дроби "кровного родства", взятые с сайта Wolfram Alpha в два раза меньше правильных дробей, т.к создатели сайта не учитывали, что родство считается не от  одного предкового индивида, а от пары общих предков.
« Последнее редактирование: 01 Сентябрь 2010, 16:54:07 от Vadim Verenich »

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Re: The Relationship between HIRs and Relationship
« Ответ #2 : 01 Сентябрь 2010, 16:54:34 »
Эти же данные подверждаеются и генеалогией.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34618
  • Страна: ca
  • Рейтинг +2953/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: The Relationship between HIRs and Relationship
« Ответ #3 : 01 Сентябрь 2010, 18:06:30 »
На практике это означает, что можно смело брать нижний порог предикта (например, в случае с предиктом 4th-10th cousins -берем 10th) и затем умножаем на 1.5 -1.8, получая тем самым более достоверный предикт родства (15-18 поколений).
Нет не означает.
Вы сами это сможете легко проверить.
Просчет Ваших выкладок в том, что Вы напрямую увязываете родство с генетической дистанцией и полагаете, что алгоритм 23эндМи такой же. (Кстати, исчерпывающего описания используемого 23эндМи алгоритма в свободном доступе нет. Имеются только описания используемых принципов.)
А ведь если построить простенький график даже из своих РФ и АФ листов, по одной оси сантиморганы, по другой предикт, или усреднённая вилка (Вы, надеюсь, обратили внимание на то, что вероятностные относительные размеры вилки разные?), то легко можно будет увидеть, что зависимость порой отсутствует даже в пределах одной хромосомы.

Для того, чтобы понять, что Ваш вывод неверен (я отметил большую подвижку в Ваших гипотезах: с 30-40-юродного родства Вы сдвинули границы в верном направлении до родства 15-20-юродного) можно пойти от противного. Сделать попытки анализа пар, имеющих игрек-СТР результаты. То есть, сравнить результаты расчёта времён, полученных методами филогении, с предиктом и вилкой от 23эндМи. А также с размерами УПСов на сайте Леона и Василия.
Получится (при хороших парах, а не односельчанах), что либо вся система оценок времён по игрек-СТРам носит приближенный, более короткий (новохронологический :) ) порядок. Либо (что более вероятно) гипотеза о том, что большинство временных оценок от 23эндМи показывают более близкую степень родства, чем есть на самом деле, окажется неверна.

В том, что многочисленные ошибки расчёта степени родства присутствуют - я с Вами полностью согласен. Не согласен с тем, что эти ошибки имеют преобладающий характер.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34618
  • Страна: ca
  • Рейтинг +2953/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: The Relationship between HIRs and Relationship
« Ответ #4 : 01 Сентябрь 2010, 19:22:10 »
Я терпеливо ждал, что кто-нибудь заметит и укажет на основной методологический просчёт гипотез Вадима.
Но либо тема мало кому интересна (речь идёт об оценке степени родства по результатам мультиснип тестирования, т.е., о наиболее перспективной и быстроразвивающейся ветви всей ДНК-генеалогии).
Либо всё просто принимается на веру с оглядкой на энциклопедический потенциал Вадима.
Напрасно.
Сомневаться надо всегда.
Рассмотрим последнее:
На практике это означает, что можно смело брать нижний порог предикта (например, в случае с предиктом 4th-10th cousins -берем 10th) и затем умножаем на 1.5 -1.8, получая тем самым более достоверный предикт родства (15-18 поколений).
Положим. Положим, что действительно надо использовать некий поправочный коээфициент 1.5-1.8. Но почему в качестве основного значения берём только дальний порог вилки?!!
Напомню, я называю 4th-10th вилкой (Relationship Range). Т.е. это граничные значения для некоторого доверительного интервала (опять же, мы даже не знаем, какой доверительный интервал 23эндМи использует).
А предиктом называю 5th. Т.е. Predicted Relationship. Вот его то, предикт, и надо всегда использовать в качестве основного. А вовсе не дальнюю границу вилки.
Например, у меня есть три кузена с одинаковым предиктом - 5th Cousin. Но с тремя разными вилками: 3rd to 8th Cousin, 3rd to 9th Cousin, 3rd to 10th Cousin. Если мне и захочется поумножать на 1.5-1.8, то брать я всегда буду 5, а не 8, 9, или 10. Последние три числа характеризуют форму вероятностного колокола.

Напомню:

Пусть у нас имеется следующее распределение:

Условно будем полагать, что по иксам у нас идут степени родства, а по игрекам пиковые вероятности для этих степеней. (Степени по-русски, а не сдвинутыми на одного английскими кузенами. :) )
Т.е. в качестве предикта, у нас бы был записан наиболее вероятный, соответствующий 9-ти юродному родству.
Если бы в качестве доверительной вероятности были выбраны 50% (именно столько, я полагаю, использует 23эндМи), то вилка бы была где-то 2-23. (На глазок разделил колокол пополам, и от крайиних значений провёл вниз воображаемые линии.)
Если доверительную вероятность взять 75%, то дальняя граница вилки уползёт за 30.
При 95% - она растворится в далях светлых.
А вот предикт у нас будет тот же. Вилка указывает на форму распределения. Чем она меньше, тем распределение имеет более вытянутый вид. Т.е. тем выше пиковая вероятность.

Ошибки по краям интервала носят совсем другую природу, нежели та, что принимает в расчёт Вадим.

Об этом я отпишу чуть-чуть позже (сейчас надо на час отлучиться. :) )

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34618
  • Страна: ca
  • Рейтинг +2953/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: The Relationship between HIRs and Relationship
« Ответ #5 : 01 Сентябрь 2010, 21:06:41 »
На мой взгляд речь идёт о неправильной, неррациональной затрате усилий.
Судите сами, поправки и гипотезы Вадима вторгаются в область глобальной разработки методов оценок родства. Т.е., напоминают бесконечные споры о правильностях расчёта TMRCA в игрек-СТР и мито филогении. Эти споры, по определению, могут привести только к появлению ещё одной новой, или не слишком новой, неподтверждённой гипотезы.
Потом, не будем забывать, что в этом направлении и так уже много исследователей. Достаточно отметить, что 23эндМи вносит постоянные коррективы в свои оценки.
А вот есть направление практически нетронутое. Направление, которое по сути и является основным источником всех ошибок.
Речь идёт о ложных УПСах и вызываемых ими неправильных умозаключениях.
Не о реликтовых УПСах, или спорных участках хромосом, присущих той или иной популяции. А именно о ложных УПСах:



Наверняка, уже многие столкнулись со случаем, когда степень родства с потомком выше, чем с любым из его родителей.
Например у меня и у уважаемого kindsvaters есть ложный УПС, который отсутствует, как с его отцом, так и с его мамой.
Именно тут было бы неплохо сосредоточить вектор усилий. Т.е. подобно тому, как Дмитрий Адамов и Анатолий Клёсов сделали разработку влияния возвратных мутаций на расчёты времён, тот же Дмитрий Адамов, в содружестве с Сергеем Каржавиным и при помощи Вадима Веренича, могли бы оценить доверительные интервалы и эффекты влияния ложных УПСов на оценку степени родства. В качестве исходных величин при этом использовать размерность мультиснип панели, плотность рассматриваемых снипов на разных участках хромосом, генетическую дистанцию в сантиМорганах, спорные участки хромосом, и степень родства.
Это был бы новый, никем ранее не освещённый материал, а не пережёвывание бесконечной жвачки выявления мелких просчётов.
« Последнее редактирование: 01 Сентябрь 2010, 21:26:08 от Mich Glitch »

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34618
  • Страна: ca
  • Рейтинг +2953/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: The Relationship between HIRs and Relationship
« Ответ #6 : 02 Сентябрь 2010, 09:35:38 »
Естественно, надо рассмотреть и влияние обычной инструментальной ошибки. Так называемые no-calls.
Если память не изменяет, именно из-за этих самых ноу-колзов моё родство  с уважаемой Yulita ближе, чем с её бабушкой.
Весь результат вполне можно ужать в формулы и поправочные таблицы.
Затем выверка на имитационных моделях.
Завершающий аккорд - интерпретация реальных данных.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Re: The Relationship between HIRs and Relationship
« Ответ #7 : 02 Сентябрь 2010, 13:38:23 »
Апдейт от доктора Микроба (microbeDr) с форума 23ия

Цитировать
I am impressed that the inherited by decent works as well as it does. It is very dependent on the frequency of the rare allele at the chosen SNPs. To not be IBD the individuals need to be homozygous for different alleles at a locus. I have used James McMillan’s data (from 293 individuals) to determine the frequency of homozygosity and heterozygosity at each SNP. I have calculated for chromosome 22 (guess why #22) that the rare allele is homozygous less than 1% in 15% of the SNPS and less than 6% in 51% of the SNPs (shown in table below). Thus for 50% of the SNPs it would be relatively rare for two people of the same ethnic background to be homozygous for the opposite alleles. In addition nearly 10% of the SNPs are heterozygous in greater than 50% of the individuals so it would be rare for neither individual to be heterozygous at these sites so the IBD run would not be broken. Someone who is more computer savvy or likes math more than I do can tell us what this means.

1%- 0.15
2% - 0.26
3% - 0.34
4% - 0.40
5% - 0.46
6% - 0.51
7% - 0.55
8% - 0.59
9% - 0.62
10% - 0.66
11% - 0.68

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Re: The Relationship between HIRs and Relationship
« Ответ #8 : 02 Сентябрь 2010, 13:40:22 »
И уточнения от автора слайдов в первом посте -Джона Кини (john26)

Цитировать
1) 23andme uses 3808, not 3547 which is based on my data which includes a small % of no calls.

2) RF's % DNA Shared is a calculated, not measured, number. For 10 of your 12 data points, % DNA Shared = segment's cM / (2*3808) with a 90% error CI of [0%, 0.7%]. For you and your sister, the 2888 number is 16.4% low, and for your aunt / double cousin 5.4% low. Don't know why.

3) The different slopes (1.56 v 1.88) I computed for the 2 family data sets indicates one formula does not fit all. Maybe there is a way to correct for differences, viz., tweaks for various groups.




Оффлайн warwick

  • Сообщений: 234
  • Рейтинг +65/-0
  • Y-ДНК: R1b U106
  • мтДНК: K1a1b1a
Re: The Relationship between HIRs and Relationship
« Ответ #9 : 01 Ноябрь 2010, 00:11:42 »
Confirmed 6th cousin, once removed:

Joyce Allen 1719-1751
John Easley 1712-1746


29.36 cM shared

block distribution: (cM)
8.33
3.79
3.51
2.77
2.66
2.48
2.31
1.94
1.57


Оффлайн Anode

  • Группа N
  • *
  • Сообщений: 1500
  • Страна: ca
  • Рейтинг +145/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Re: The Relationship between HIRs and Relationship
« Ответ #10 : 26 Ноябрь 2010, 05:22:02 »
Появились уже 6 родственников в ФФ с 8-9сМ участком на 19й хромосоме. Всего у меня 19ть кузенов, и _все_ - пятиюродные. Аномалия какая-то. И где более дальние то?

19   6787271   13019783   7.97 <- у этого кузена - все 57 фамилий в профиле из Швеции или Финляндии-Швеции
19   6787271   13019783   7.97 <- у этого - все из Шотландии
19   6787271   13019783   7.97 <- этот для разнообразия не показывает фамилии (должен же кто-то?)
19   8274794   15504590   7.92 <- Австрия, Ирландия
19   5795537   11295505   9.32 <- фамилий не видно, кроме одной польской (сейчас напишу, поклянчу фамилии)
19   6636230   12049317   8.33 <- все из Айовы, немного из Канзаса, США (у человека пробито до 1830х, только один, вроде из Германии)

Напомню, что фтдна показывает их всех как 5-юродных.
Вся европа, включая США, всего 5 поколений назад? (при том что я знаю, что как минимум до 1850-1870 никого не было иностранцев в моих предках) "Не верю"(С).

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34618
  • Страна: ca
  • Рейтинг +2953/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: The Relationship between HIRs and Relationship
« Ответ #11 : 26 Ноябрь 2010, 08:04:50 »
Во-первых, 5th cousin - это шестиюродный брат.
Во-вторых, шестиюродное родство - это предел, далее которого ФТДНА с данным чипом не берётся предсказывать родство.

У меня из 23 родичей только 3 имеют УПС на 19 хромосоме.

Вот они все:

Howard John Hall   19   8274794   15504590   7.92   703
Ila M. Kraft   19   6787271   13019783   7.97   586
Janice  Billings   19   6787271   13019783   7.97   586

Как видите, к тому же пара ещё и родственники.

Василий, я настоятельно Вам рекомендую вот эту новую игрушку (ссылка).

По поводу пересечений с заграницей, сдаётся мне большая часть их идёт через украинско-еврейское взаимодействие. Посмотрите, пожалуйста, шесть сообщений, начиная вот отсюда.

Оффлайн Anode

  • Группа N
  • *
  • Сообщений: 1500
  • Страна: ca
  • Рейтинг +145/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Re: The Relationship between HIRs and Relationship
« Ответ #12 : 26 Ноябрь 2010, 16:41:21 »
Спасибо!

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100