АвторТема: Влияние топологии дерева на сдвиг оценки ТМRCA по внутрикладовой АSD.  (Прочитано 12301 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Считаем возраст всей популяции 1 100 000чел. методом внутрикладовой ASD.Напомню, что реальный возраст до общего предка, который и должен получиться 100 покол.
4мут. между выжившими -726,17 покол.
3-436,91
2-230,29
1-106,33
0-65,00
Линейный метод -
4-309,45
3-236,79
2-171,37
1-112,51
0-65,01
Средний возраст(средневзвешенный) получается
ASD-70,8 покол.
лин.-71,34
Средневзвешенный по двум наиболее частым(более 95,5%) вариантам(0 и 1 мутация)
ASD- 70,07
лин.-70,88
В большинстве случаев, в данном примере 87,3%, оба метода дают возраст бутылочного горлышка - 65 покол.
Надо заметить, что в реальных расчётах разброс результатов будет компенсироваться количеством маркеров. При большом их количестве большая часть маркеров будет давать занижение, меньшая завышение. По всему гаплотипу, опять-таки в большинстве случаев, результат будет занижен из-за популяционного эффекта.

Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Теперь представим, что два выживших после бутылочного горлышка потомка имеют разные снипы, что позволяет их потомков надёжно разделить на субклады и посчитать интеркладовыми методами.
Кросс-ASD
4-4065 покол.
3-2315
2-1065
1-315
0-65
Разброс результатов огромный, но в большинстве случаев те же 65 покол. - возраст бутылочного горлышка.
А вот средневзвешенный получился 100,1 покол. Это совершенно не значит, что метод не подвержен популяционному влиянию, просто в данном приведенном примере заданный популяционный эффект не оказал популяционного влияния на оценку TMRCA этим методом.
Средневзвешенный по двум наиболее частым разностям(0 и 1 мутация) дал 95,7 покол.


Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Пробовал я считать этот пример и методом Клависа.
При 4 мутациях дошёл до 3,996 мутаций - среднее расстояние между двумя гаплотипами разных субкладов. Нужно ещё ввести поправку на возвратные мутации(не стал это расчитывать), затем разделить на 2 и на скорость мутации. В любом случае возраст получается запредельный.
А вот при 1 и 0 мутаций посчитал.
1-473 покол.
0-65 покол.
Т.е. при 0 мутаций, как и во всех других методах получился возраст бут.горлышка.
Средневзвешенный этим методом по двум наиболее частым вариантам(1 и 0 мут.) получается завышенным 110 покол. По всем вариантам будет ещё выше.
Некоторые свои выводы напишу чуть позже. Какие будут мнения?

Оффлайн Clavis

  • Семенов Михаил Юрьевич
  • Сообщений: 1497
  • Страна: ru
  • Рейтинг +110/-0
    • https://m.vk.com/@clavis1953
  • Y-ДНК: G2a2 L1264
  • мтДНК: HV9, ранее известная как HV3a
Пробовал я считать этот пример и методом Клависа.
При 4 мутациях дошёл до 3,996 мутаций - среднее расстояние между двумя гаплотипами разных субкладов. Нужно ещё ввести поправку на возвратные мутации(не стал это расчитывать), затем разделить на 2 и на скорость мутации. В любом случае возраст получается запредельный.
Но ведь 4 мутации - частный случай, один из множества вариантов, а если представить его как среднее расстояние между гаплотипами, то действительно придем к абсурду, такая дистанция наверное только между человеком и неандертальцем. Среднее расстояние получится как средневзвешенное по всем случаям, среди которых ноль мутаций будет много чаще чем четыре мутации.
Второе замечание - на практике мы считаем не по одному маркеру; Нордтведт использует 55. Если в одном маркере между двумя выжившими потомками будет экстремально большая разница, то в большинстве маркеров они  вообще  будут идентичны.
Популяционные эффекты не могут приводить к закономерному смещению расчетного возраста общего предка двух субкладов в ту или другую сторону, потому что в модели не найти ни следа подобного влияния - просто в результате бутылочных горлышек наша выборка из двух субкладов вырождается, в крайнем случае (если горлышки совсем недавние) она превращается в выборку из двух гаплотипов. А два произвольно взятых из выборки гаплотипа могут равновероятно дать как занижение, так и завышение расчетного возраста предка относительно среднего возраста для исходной выборки. Собственно, на практике у нас есть как реально существующие горлышки (историческое наследие), так и виртуальные: ирландцы активно сдают ДНК-тесты, а тунисцы - практически не сдают, а завтра начнут сдавать, и данный популяционный эффект рассосется сам собой.

Оффлайн shekhol

  • Сообщений: 752
  • Страна: ru
  • Рейтинг +127/-2
  • Y-ДНК: N1*(L1025+)
Пробовал я считать этот пример и методом Клависа.
При 4 мутациях дошёл до 3,996 мутаций - среднее расстояние между двумя гаплотипами разных субкладов. Нужно ещё ввести поправку на возвратные мутации(не стал это расчитывать), затем разделить на 2 и на скорость мутации. В любом случае возраст получается запредельный.
Но ведь 4 мутации - частный случай, один из множества вариантов, а если представить его как среднее расстояние между гаплотипами, то действительно придем к абсурду, такая дистанция наверное только между человеком и неандертальцем. Среднее расстояние получится как средневзвешенное по всем случаям, среди которых ноль мутаций будет много чаще чем четыре мутации.
Второе замечание - на практике мы считаем не по одному маркеру; Нордтведт использует 55. Если в одном маркере между двумя выжившими потомками будет экстремально большая разница, то в большинстве маркеров они  вообще  будут идентичны.
Популяционные эффекты не могут приводить к закономерному смещению расчетного возраста общего предка двух субкладов в ту или другую сторону, потому что в модели не найти ни следа подобного влияния - просто в результате бутылочных горлышек наша выборка из двух субкладов вырождается, в крайнем случае (если горлышки совсем недавние) она превращается в выборку из двух гаплотипов. А два произвольно взятых из выборки гаплотипа могут равновероятно дать как занижение, так и завышение расчетного возраста предка относительно среднего возраста для исходной выборки. Собственно, на практике у нас есть как реально существующие горлышки (историческое наследие), так и виртуальные: ирландцы активно сдают ДНК-тесты, а тунисцы - практически не сдают, а завтра начнут сдавать, и данный популяционный эффект рассосется сам собой.

Статистические данные интересны для науки, а лично меня в первую очередь будут интересовать именно частные случаи, применительно к моему ген дереву, да и, думаю, всех остальных также.

Оффлайн Nimissin

  • Сообщений: 2347
  • Рейтинг +724/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Теперь представим, что два выживших после бутылочного горлышка потомка имеют разные снипы, что позволяет их потомков надёжно разделить на субклады и посчитать интеркладовыми методами.
Кросс-ASD
4-4065 покол.
3-2315
2-1065
1-315
0-65
Разброс результатов огромный, но в большинстве случаев те же 65 покол. - возраст бутылочного горлышка.
А вот средневзвешенный получился 100,1 покол. Это совершенно не значит, что метод не подвержен популяционному влиянию, просто в данном приведенном примере заданный популяционный эффект не оказал популяционного влияния на оценку TMRCA этим методом.
Средневзвешенный по двум наиболее частым разностям(0 и 1 мутация) дал 95,7 покол.


В среднем все-таки никакого популяционного сдвига нет. Но популяционные эффекты приводят к гигантскому разбросу в оценке TMRCA двух кладов. Спасибо, уважаемый VVR. Приведенный Вами пример очень нагляден.

Оффлайн shekhol

  • Сообщений: 752
  • Страна: ru
  • Рейтинг +127/-2
  • Y-ДНК: N1*(L1025+)
Теперь представим, что два выживших после бутылочного горлышка потомка имеют разные снипы, что позволяет их потомков надёжно разделить на субклады и посчитать интеркладовыми методами.
Кросс-ASD
4-4065 покол.
3-2315
2-1065
1-315
0-65
Разброс результатов огромный, но в большинстве случаев те же 65 покол. - возраст бутылочного горлышка.
А вот средневзвешенный получился 100,1 покол. Это совершенно не значит, что метод не подвержен популяционному влиянию, просто в данном приведенном примере заданный популяционный эффект не оказал популяционного влияния на оценку TMRCA этим методом.
Средневзвешенный по двум наиболее частым разностям(0 и 1 мутация) дал 95,7 покол.


В среднем все-таки никакого популяционного сдвига нет. Но популяционные эффекты приводят к гигантскому разбросу в оценке TMRCA двух кладов. Спасибо, уважаемый VVR. Приведенный Вами пример очень нагляден.

В среднем температура больных в больнице будет 36,6C :)

Оффлайн Nimissin

  • Сообщений: 2347
  • Рейтинг +724/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Для снижения разброса надо использовать как можно больше STR локусов (маркеров).

Оффлайн ОводАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 1785
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Цитировать
В среднем температура больных в больнице будет 36,6C

Достали уже с этой "средней температурой по больнице". Но в данном случае эта аналогия порочна: в кросс-методах мы считаем не по больнице, а между отделениями.
 
И разумно ожидать, что средняя температура в инфекционном отделении будет выше чем, скажем, в травме или в морге. В среднем. Но это не значит, что у умершего инфекционного больного, которого ещё не успели отвезти в морг, она будет также выше, чем у его соседа в травме.

Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Но ведь 4 мутации - частный случай, один из множества вариантов, а если представить его как среднее расстояние между гаплотипами, то действительно придем к абсурду, такая дистанция наверное только между человеком и неандертальцем. Среднее расстояние получится как средневзвешенное по всем случаям, среди которых ноль мутаций будет много чаще чем четыре мутации.
Второе замечание - на практике мы считаем не по одному маркеру; Нордтведт использует 55. Если в одном маркере между двумя выжившими потомками будет экстремально большая разница, то в большинстве маркеров они  вообще  будут идентичны.
Абсолютно согласен. Я об этом написал во втором сообщении на этой странице. Поэтому, чем больше маркеров будет в расчёте, тем более точной будет оценка TMRCA. Но в любом случае, если имеем два субклада, имеющих общего предка, то основатели этих субкладов будут иметь между собой на 67м какую-то случайную дистанцию. Разброс этой величины не будет слишком большим, но определённую погрешность будет давать в любом интеркладовом методе.

Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h

Статистические данные интересны для науки, а лично меня в первую очередь будут интересовать именно частные случаи, применительно к моему ген дереву, да и, думаю, всех остальных также.
Меня в первую очередь тоже интересует дерево своей ветви. Вот и думаю над разными подходами к оценке возраста.

Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
В среднем все-таки никакого популяционного сдвига нет. Но популяционные эффекты приводят к гигантскому разбросу в оценке TMRCA двух кладов. Спасибо, уважаемый VVR. Приведенный Вами пример очень нагляден.
Популяционный сдвиг в интеркладовых методах обязательно будет. В кросс-ASD это очевидно. Просто не дали сдвига в данном частном примере заданные мной условия, а именно бутылочное горлышко и неравномерность развития(увеличения численности) двух субкладов.
Ведь я заложил в модель, что до горлышка и после поп. эффекта нет. В реальности он обязательно будет и соответственно будет популяционный сдвиг.
В методе Клависа я пока "ухватить за хвост" и соответственно наглядно показать этот популяционный сдвиг не могу, но он тоже есть.

Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Мне кажется, что такие возможные отклонения в отдельных маркерах - это ещё камешек в огород метода Каржавина(ММП без учёта топологии). Хотя может там есть какие-то приёмы учитывать такие случаи и я просто о них не знаю.

Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Выводы, которые можно сделать, но которые были очевидны и ранее.
1. Все методы оценки возраста далеко не идеальны.
2. Все методы подвержены влиянию популяционного эффекта.
3. Для всех методов желательно использовать гаплотипы с максимально возможным количеством маркеров.

Оффлайн ОводАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 1785
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Популяционный сдвиг в интеркладовых методах обязательно будет. В кросс-ASD это очевидно.

Опять двадцать пять. А я уже считал, что убедил Вас.  >:(   Откуда это очевидно-то? Мне так очевидно обратное. Посмотрите хотя бы сюда: http://forum.molgen.org/index.php/topic,1688.msg69599.html#msg69599
 
Но уже хорошо, что уважаемый Нимиссин эту очевидность воспринял.
 
Хотя в дальнейшем прошу все посты про этот мифический сдвиг в кросс-ASD размещать в соотв.теме. Желательно, с аргументами.
 
А то - очевидно, и всё. Когда-то кому-то было очевидно, что Земля плоская. Некоторые и сейчас утверждают это: не катится же по ней ничего, как по шару.  :D
 
 
« Последнее редактирование: 21 Декабрь 2010, 20:35:42 от Овод »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.