АвторТема: Определение возраста субклада  (Прочитано 13080 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн VVR

  • ...
  • Сообщений: 2456
  • Страна: ua
  • Рейтинг +618/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Re: Определение возраста субклада
« Ответ #30 : 14 Февраль 2010, 02:54:51 »
Неужели в Ракетно-Артиллеристких Училищах так плохо преподавали математику?
Не знаю. Я "Ракетно-Артиллеристских" училищ не заканчивал. Я закончил высшее артиллерийское командное училище. Преподавали не только высшую математику, но и теорию вероятности. Большая часть того, что по этим предметам преподавали, основательно забылась, поскольку на практике применять не пришлось. Эти дисциплины нужны для теоретического обоснования правил стрельбы и управленя огнём артиллерии, но для практического применения  этих правил бесполезны.

Привлекая модалы, Вы разбиваете вычисление возраста на этапы - от листиков одной группы до её модала, затем - между двумя модалами , и, наконец, от второго модала - до его листов. Затем суммируете, делите на два и получаете время общего предка.
 
Разумеется, на каждом этапе вы вычисляете не только "видимые" мутации, но и предсказываете количество возвратных (тем или иным способом), делая расчет возраста с их учётом.

Именно так.

(если не делаете дополнительной ошибки, включая в расчёт еще и общий модал ветвей)
Вы невнимательно читали моё сообщение. Лишнего приписывать мне не надо.

Вы наивно полагаете, что
Может быть и наивно, но я полагаю совсем другое, а не то что Вы мне приписываете.Опять невнимательно читали. Я же написал(цитирую себя дословно):"Что занижает возраст понятно, я даже объяснял причины занижения." Уточню, что объяснял и подробно на другом форуме. И писал, что погрешность при разбиении на ветви и подсчёте этим методом существенно увеличивается. Так что в этом вопросе мои взгляды в основном сходятся с Вашими.

Вот тут то и кроется Ваша ошибка:
Да не моя это ошибка, а метода. Вы предлагаете другой, но так и не объяснили за счёт чего он даёт более точный результат и как решает эту проблему.

Отсюда и Ваша недооценка возраста. Теперь - понятно?
Во-первых, опять-таки не моя, а метода.
Во-вторых, не только отсюда. Есть и другие факторы.
В-третьих, то что Вы мне объяснили, мне было понятно и раньше.

На всякий случай приведу "артиллеристкую" аналогию.
Ну разве что на всякий случай. ;D
Как я понял, от артиллерийской терминологии Вы далеки. Но Ваш пример безусловно понятен, только зачем он? См. выше "в-третьих".

Оффлайн Clavis

  • Семенов Михаил Юрьевич
  • Сообщений: 1495
  • Страна: ru
  • Рейтинг +111/-0
    • https://m.vk.com/@clavis1953
  • Y-ДНК: G2a2 L1264
  • мтДНК: HV9, ранее известная как HV3a
Re: Определение возраста субклада
« Ответ #31 : 14 Февраль 2010, 09:01:01 »
Функция, связывающая наблюдаемыемое и "предсказанное" число мутаций нелинейна, более того - экспоненциальна.
Тут проблем не вижу. Скажем, приняли скорость мутаций 0,002 за 25 лет. Через 10000 лет средневероятное число предсказанных, то есть истинно произошедших, мутаций будет 0,800 на маркер, наблюдаемых 0,575.
Этот промежуточный результат (0,800) и поправка на него - только для людей, не любящих электронные таблицы или не умеющих ими пользоваться. Я не пользуюсь 0,800 и сразу беру 0,575.

(самая большая дистанция между гаплотипами выборки получилась 52 мутации)
« Последнее редактирование: 16 Февраль 2010, 08:55:02 от Clavis »

Оффлайн Clavis

  • Семенов Михаил Юрьевич
  • Сообщений: 1495
  • Страна: ru
  • Рейтинг +111/-0
    • https://m.vk.com/@clavis1953
  • Y-ДНК: G2a2 L1264
  • мтДНК: HV9, ранее известная как HV3a
Re: Определение возраста субклада
« Ответ #32 : 14 Февраль 2010, 09:09:29 »
Привлекая модалы, Вы разбиваете вычисление возраста на этапы - от листиков одной группы до её модала, затем - между двумя модалами (если не делаете дополнительной ошибки, включая в расчёт еще и общий модал ветвей), и, наконец, от второго модала - до его листов. Затем суммируете, делите на два и получаете время общего предка.
Тут я полностью разделяю недовольство Овода. Допустим, среднее по выборке значение маркера 9.50. Какое примем для предка выборки - 9 или 10? и то, и другое - произвол и гадание на кофейной гуще. И даже если 9.83, то не гарантия, что было 10 - могли размножиться "десятки" и замаскировать предка-"девятку".
Поэтому модалом я пользуюсь только в случае поиска места новому гаплотипу на существующем древе, и то выражаю его через дробные числа (9.50 означает, что 9 и 10 равновероятны), а для вычислений TMRCA я модалом не пользуюсь.
Вообще, если уж мы взялись определить время жизни предка, то не надо срывать с него маску и пытаться узнать заодно его гаплотип. Тут как в принципе неопределенности Гайзенберга: если мы хотим точнее узнать местонахождениe электрона, надо примириться с неопределенностью импульса, хотим уточнить импульс - потеряем точность координат.
« Последнее редактирование: 14 Февраль 2010, 09:24:53 от Clavis »

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Определение возраста субклада
« Ответ #33 : 14 Февраль 2010, 13:50:11 »
Уважаемый VVR, не воспринимайте мои "казарменные" шуточки в личном плане. На всякий случай (если они Вас чем-то обидели) - прошу прощения. Если Вы, в Ваших вычислениях не используете модальные гаплотипы, так с чего же Вы тогда взялись мне возражать? В таком случае - можете заменить личное местоимение "Вы" в моём предыдущем посту множественным числом "вы", адресуемым мной к тем, кто это делает.
 
Теперь о том, почему кросс-методы при определении времени общего предка двух кладов не делают ошибки, в отличие от "модального". Имено потому, что они не разбивают расстояние между двумя современниками из разных кладов на "этапы", а считают как наблюдаемые, так и "предсказанные" мутации по всему независимому интервалу наблюдений целиком. Или что ещё Вы хотели узнать?

Оффлайн VVR

  • ...
  • Сообщений: 2456
  • Страна: ua
  • Рейтинг +618/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Re: Определение возраста субклада
« Ответ #34 : 15 Февраль 2010, 02:33:06 »
Какие обиды? Просто хочется объективно прояснить вопрос.

Если Вы, в Ваших вычислениях не используете модальные гаплотипы, так с чего же Вы тогда взялись мне возражать?
В том то и дело, что использую.Опять таки повторюсь, использую, понимая, что это увеличивает погрешнось.

кросс-методы при определении времени общего предка двух кладов не делают ошибки, в отличие от "модального". Имено потому, что они не разбивают расстояние между двумя современниками из разных кладов на "этапы", а считают как наблюдаемые, так и "предсказанные" мутации по всему независимому интервалу наблюдений целиком.
Если у Вас это единственное возражение, то его нетрудно избежать. Можно ведь вводить поправку на возвратные мутации на весь интервал одноразово.
Я думаю без примера уже не обойдёшься.
Например на дереве 67м 2 ветви. 1-я ветвь - в среднем 12,4 мутации на гаплотип. 2-я ветвь - 16,8  мутации на гаплотип. Между модалами 10 мутаций. (12,4+16,8+10)/2=19,6
Делим на скорость гаплотпа 19,6/0,145=135 поколений.С поправкой по таблице Адамова 156 поколений. Я добавил 3 возвратных мутации (21х0,145=3) в среднем на гаплотип, т.е. с учётом экспоненциальности их возрастания.
Только не пишите, что я наивно предполагаю, что очень точно определил возраст. Прекрасно понимаю, насколько этот рассчёт приблизителен и сколько там подводных камней.
Я не понимаю, как кросс-дисперсионные методы обходят эти подводные камни и  насколько лучше. Хотелось бы на примере увидеть.
Если можно, малюсенький пример для Овода и Клависа, если захотят.
7 5-маркерных гаплотипов.
DYS449,DYS 576,DYS 570,CDYa,CDYb
1-28,18,20,35,39
2-32,16,20,31,34
3-29,15,18,33,40
4-32,18,22,38,39
5-28,18,18,31,37
6-29,16,19,35,35
7-32,18,21,34,39
Скорости маркеров можно брать Чандлеровские - те, что давал Клавис: http://forum.molgen.org/index.php/topic,15.135.html

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Определение возраста субклада
« Ответ #35 : 15 Февраль 2010, 12:24:40 »
Не буду я Ваш примерчик считать, смысла не вижу. Во-первых, он не удовлетворяет условиям нашей задачи - определению общего предка двух субкладов. У Вас же там только один. Здесь просто нет условий для применения кросс-методов.
 
Во-вторых, даже если бы субкладов было два, не имеет смысла судить о стат.свойствах оценки возраста (отсутствию смещения) по однократному её вычислению. Нужно либо репрезентативное множество таких оценок, либо - аналитическое даказательство её несмещённости для генеральной совокупности. Гармонию нужно проверять не арифметикой, а алгеброй. Странно, что Вы этого не поняли, изучая статистику в ВУЗе.
 
Если Вас не убедили мои пояснения, изложенные ранее - можете обратится к литературе. Стат.свойства квадратичных кросс-оценок там давно и неоднократно изучены. В частности, можете сходить на сайт Кена Нортведта http://knordtvedt.home.bresnan.net/ - там есть статьи с детальным описанием этих свойств. Он не первый, кто доказал несмещённость кросс-ASD (первым был Морар ещё в конце прошлого века), но изложил доказательства достаточно доступным языком. Меня же от дальнейшего обсуждения этой проблемы увольте - не хочу терять время на бесполезную дискуссию.

Оффлайн Clavis

  • Семенов Михаил Юрьевич
  • Сообщений: 1495
  • Страна: ru
  • Рейтинг +111/-0
    • https://m.vk.com/@clavis1953
  • Y-ДНК: G2a2 L1264
  • мтДНК: HV9, ранее известная как HV3a
Re: Определение возраста субклада
« Ответ #36 : 16 Февраль 2010, 08:52:46 »
Я обещал провести внутреннюю проверку скоростей Клесова.
Для этого взял 74 67-маркерных гаплотипа из своей родной G2a3b. Просчитал все дистанции между парами гаплотипов 74*73/2=2701 дистанция.
На 67 маркеров приходится 67633 мутации, или в среднем 25 наблюдаемых мутаций разделяет пару гаплотипов (максимум 52),
в том числе на 25 маркеров (1 и 2 панели) -23313 мутации,
на 12  маркеров первой панели -11257 мутаций.
если учесть, что Анатолий Алексеевич определил суммарную скорость 0,022 для первой панели и 0,046 для первых двух, получим для 67 маркеров 0,132-0,133 или в среднем на маркер 0,00197-0,00199.
Конечно, это калибровка внутри одного произвольно взятого клада.
Но, характерно, когда я брал среднюю скорость 0,0022, интуиция говорила, что хорошо бы уменьшить на одну десятую.
Поправка получилась на 8,7-9,7%
Для 37 маркеров число мутаций 42104, скорость 0,0823-0,0831, или 0,00222-0,00225 на маркер, поправка 8,3-9,4% также в сторону увеличения возраста.
« Последнее редактирование: 19 Февраль 2010, 13:05:30 от Clavis »

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Определение возраста субклада
« Ответ #37 : 18 Февраль 2010, 12:47:48 »
Ну что же - на примере двух кластеров, один из которых состоит из К гаплотипов из M маркеров, другой - из N гаплотипов той же размерности. У Вас К*N  пар для сравнения по M маркерам - вычисляете помаркерно все разности аллелелей, возводя их в квадрат и суммируете. Сумму делите на К*N*M - это и будет оценка кросс-дисперсии.
Подскажите уж тогда, как будет для трёх кластеров (у Кена в его эксель-таблице тоже только для двух дано).

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Определение возраста субклада
« Ответ #38 : 18 Февраль 2010, 12:57:02 »
Подскажите уж тогда, как будет для трёх кластеров (у Кена в его эксель-таблице тоже только для двух дано).

Очень просто - вычисляете попарно кросс между кладами. Для трёх - будет три варианта. Ранжируете полученные возраста - это и даст Вам порядок их ветвления.
 
В таблице Кена это также можно сделать - беря пары кладов (это должны быть именно клады, не кластеры).

Оффлайн FarroukhАвтор темы

  • Maternal Y-DNA: R1b-BY124371
  • Модератор
  • *****
  • Сообщений: 17198
  • Страна: az
  • Рейтинг +5967/-17
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Re: Определение возраста субклада
« Ответ #39 : 19 Март 2012, 14:01:43 »
Возраст E-M34 на основании 20 67-маркёрных гаплотипов E-L792 и E-M84 составляет 503 поколения (12,5 тыс. лет).
Возраст E-Z830 составляет 523 поколения (13 тыс. лет). E-M123 должна быть около 510 поколений назад (12,7 тыс. лет).

Цифры огромные, но ранненеолитические. E-Z827 мигрировали из дебрей Египта к северу, оставив позади E-V68. Затем E-Z827 разделились на E-L19, ушедших в в Ливию-Тунис-Марокко и на E-Z830, ушедших в Сиро-Палестину

E-V68 остаются сидеть в Египте, породив E-M78.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.