АвторТема: Обсуждения дерева Q (версия Шада)  (Прочитано 17603 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Онлайн Eugene

  • Санктпетербурхъ
  • Сообщений: 6319
  • Страна: ru
  • Рейтинг +801/-40
    • N1c1 Y-DNA Project
  • Y-ДНК: N-BY32524
  • мтДНК: U-C1341T
Re: Обсуждения дерева Q (версия Шада)
« Ответ #45 : 14 Июнь 2012, 16:28:48 »
Я тоже не вижу никаких трудностей, если гаплотип из-за равноудаленности попадает в корень.
Это наоборот визуально только информативнее. ИМХО

Оффлайн Alexander

  • Сообщений: 669
  • Рейтинг +73/-0
  • Y-ДНК: J2b
Re: Обсуждения дерева Q (версия Шада)
« Ответ #46 : 14 Июнь 2012, 16:48:04 »
немного не понимаю сути вопроса. В любом случае мы анализируем гаплотипы ныне живущих (или живших недавно людей). И если один гаплотип или группа оказывается в корне дерева, то я это рассматривают как оценку их возраста (местоположения на дереве) относительно других гаплотипов. Таким образом, кластер  Shockey (или CE по моей классификации) в данной версии дерева имеет возраст (точку расхождения с другими ветвями) более 4000 лет. А средний возраст кластера будет совсем другой - если его просчитать изолировано от остальных гаплотипов, то он будет соответствовать датам жизни их исторического предка. Наверное. Нужно бы проверить:)
Ну, про 4000 лет Бог с ними. Но помогите вот в чём.
Мой вопрос несколько выходит за рамки только дерева Q1b, и лежит в рамках расчёта TMRCA методом выборочных пар. В основе метода – разделение выборки по ветвям, идущим от корня. Генеалогия Шакке (или CE) – хороший пример для уяснения сути. В их выборке 15 шт. 67-маркерных гаплотипов (у меня в наличии, в частности).
Если взять только эту малую выборку и построить деревце, то, например, в ТНТ увидим следующую картинку (Ht обозначены номерами по порядку, в скобках – номер кита):
Best score: 14.  1 trees retained.
Tree 0:
       ┌── Modal
       │     ┌── 15 (115454)
       │     ├── 14 (184450)
       │     ├── 13 (151567)
├──┤     ├── 7  (122954)
       │     ├── 6  (120860)
       │     ├── 5  (132578
       │     ├── 4  (132437)
       └──┼── 3  (152558)
              ├── 2  (N63269)
              │     ┌── 12 (124773)
              ├──┴── 8 (163316)
               │     ┌── 9 (120859)
               │     ├── 1 (137432)     
               └──┤     ┌── 11 (119556)
                      └──┴── 10 (179058)
Укоренение сделано на модальный гаплотип (в данном случае он корень). И от корня мы наблюдаем три исходящие ветви (2-15; 8-12 и 10-11). Проставив номера ветвей в калькулятор Семаргла, получаем оценку МВП=0,02215 мут/мрк/поколение.
Для сравнения оценка ASD и она же Line =0,0199. Пересчёт по константам Клёсова (0,00179 и 25 лет) даёт в первом случае TMRCA=300 лет и TMRCA=275 лет во втором и третьем случае. Обе величины близки к дате рождения основателя генеалогии (1720).
Однако, филогения по мизерным выборкам недостоверна, и вывод следует сам собой - следует ориентироваться на большое дерево, из которого достаточно было бы вырезать кластер с нужной генеалогией и тогда уже более достоверно определить ветви.
Вопрос - в представленном мурочном Qb1-tree кластер Шакке очевиден и компактен. Как выявить ветви, идущие от корня кластера (где этот корень и сколько ветвей)?
Было бы неплохо, также, сравнить результат с Ро-возрастом, но это вторично.

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6229
  • Страна: ru
  • Рейтинг +1092/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #47 : 11 Ноябрь 2012, 10:57:29 »
Оценка возраста Q1b (L275) различными методами.

Был применен метод выборочных парк с использованием калькулятора Семаргла: http://www.semargl.me/ru/dna/ydna/tools/asd-pairs/

Расчет велся по 188 гаплотипам разделенным на несколько ветвей по снипам. Гаплотипы были 66-маркерные (маркер dys425 c делецией был удален; хотя делеция присутствует во всех исследуемых гаплотипах). ASDmvp = 27,8852193995.
ASDmvpmrk был получен равным 0,422503324235. Эти результаты можно зафиксировать и "отлить в бронзе", а дальше начинаются приблизительные расчеты. 
Mutation rate для расчета была принята равной 0,00179 (рекомендация авторов метода для 67-маркерного гаплотипа, откалибрована для поколения равного 25 годам). Тут, конечно, имеется много вопросов. Один из них - насколько рекомендация данная в отношении 67-маркерного гаплотипа применима для 66-маркерного... Второй - авторы оговаривают, что калибровка проведена для линейного метода. Но предположим, что погрешность будет не существенной.
Итого получен возраст равный 5901 год назад (5,9 kyo). Или примерно начало IV тысячелетия до нашей эры.



Аналогичный результат получен при расчете на Мурке: 5,7 kyo (при Ро=165, дающем наиболее адекватную филогению). При этом расчет велся по четырехзначным весам со снипами, имеющими вес от 9999 до 3333 (для нисходящих снипов).

А теперь не о совсем приятном. Параллельно выполненный в том же калькуляторе расчет для линейного метода (по тому же набору данных) дал:
number of mutations in all haplotype: ASDline = 11,7890508936
number of mutations in own marker: ASDlinemrk = 0,178621983237
Что в пересчете на ту же скорость и возраст поколению дают всего 2,5 kyo...
« Последнее редактирование: 11 Ноябрь 2012, 11:23:38 от Шад »

Оффлайн Nimissin

  • Сообщений: 2116
  • Рейтинг +575/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b4
Re: Обсуждения дерева Q (версия Шада)
« Ответ #48 : 11 Ноябрь 2012, 11:53:59 »
Уважаемый Шад, можно ли прислать мне Вашу выборку? Попробую проверить результат линейного метода.

Оффлайн Alexander

  • Сообщений: 669
  • Рейтинг +73/-0
  • Y-ДНК: J2b
Re: Обсуждения дерева Q (версия Шада)
« Ответ #49 : 11 Ноябрь 2012, 14:44:02 »
... средний возраст кластера будет совсем другой - если его просчитать изолировано от остальных гаплотипов, то он будет соответствовать датам жизни их исторического предка. Наверное. Нужно бы проверить:)
Как-то я пробовал рассчитать возраст кластера (ветви ТНТ ) таким образом:
- из большого дерева выделяем ветвь -  кластер с нужной генеалогией;
- на выделенном кластере выявляем первый "древний" узел (напомню, что ТНТ-дерево имеет классический немедианный вид);
- определяем пару разделившихся подветвей;
- считаем TMRCA калькулятором Семаргла МВП.
     Как правило (в ТНТ), получалось в одной из таких ветвей - один гаплотип (скажем, самый древний, прикорневой), в другой - все остальные. Но вот беда, для группы 111-маркерных прикорневым был один, для такой же группы их же, но 67-маркерных - другой, а тот бывший затесался в самую "молодую" группу. А если добавить 67-маркерных побольше, то вообще третий. Получается, что филоразделение на ветви даже для точного их отождествления (с последующим расчётом МВП) достаточно условно.
Поэтому, возможно, для такого случая, наилучшим решением будет перебор МВПР. Строить дерево в интересах МВП следует только для выявления собственно кластера (ветви). А внутри кластера ветвление выявить простым перебором всех вариантов сочетаний гаплотипов. Самый древний из полученных результатов и есть TMRCA ветви. А ещё проще - просто перебрать сочетания типа - гаплотип №1 и все остальные, гаплотип №2 и все остальные и т.д ( с учётом, что структура "1+все остальные" - наиболее распространена).
Увы, нет времени на проверку гипотезы, но возможно, что для генеалогий Q-дерева, такой перебор был бы полезен, тем более, что выборки не такие уж и большие.

Оффлайн Nimissin

  • Сообщений: 2116
  • Рейтинг +575/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b4
Re: Обсуждения дерева Q (версия Шада)
« Ответ #50 : 17 Ноябрь 2012, 09:44:10 »
Оценка возраста Q1b (L275) различными методами.

Был применен метод выборочных парк с использованием калькулятора Семаргла: http://www.semargl.me/ru/dna/ydna/tools/asd-pairs/

Расчет велся по 188 гаплотипам разделенным на несколько ветвей по снипам. Гаплотипы были 66-маркерные (маркер dys425 c делецией был удален; хотя делеция присутствует во всех исследуемых гаплотипах). ASDmvp = 27,8852193995.
ASDmvpmrk был получен равным 0,422503324235. Эти результаты можно зафиксировать и "отлить в бронзе", а дальше начинаются приблизительные расчеты. 
Mutation rate для расчета была принята равной 0,00179 (рекомендация авторов метода для 67-маркерного гаплотипа, откалибрована для поколения равного 25 годам). Тут, конечно, имеется много вопросов. Один из них - насколько рекомендация данная в отношении 67-маркерного гаплотипа применима для 66-маркерного... Второй - авторы оговаривают, что калибровка проведена для линейного метода. Но предположим, что погрешность будет не существенной.
Итого получен возраст равный 5901 год назад (5,9 kyo). Или примерно начало IV тысячелетия до нашей эры.



Аналогичный результат получен при расчете на Мурке: 5,7 kyo (при Ро=165, дающем наиболее адекватную филогению). При этом расчет велся по четырехзначным весам со снипами, имеющими вес от 9999 до 3333 (для нисходящих снипов).

А теперь не о совсем приятном. Параллельно выполненный в том же калькуляторе расчет для линейного метода (по тому же набору данных) дал:
number of mutations in all haplotype: ASDline = 11,7890508936
number of mutations in own marker: ASDlinemrk = 0,178621983237
Что в пересчете на ту же скорость и возраст поколению дают всего 2,5 kyo...
Уважаемый Шад, я сделал расчет линейным методом возраста присланной Вами выборки из 188 гаплотипов по 66 маркерам. Результат - 0.177 мутаций на маркер на гаплотип. То есть формально величина ASDlinemrk = 0,178621983237, рассчитанная калькулятором, правильная.
Но на самом деле -  это возраст фантомного предка. Линейный метод относится к не к интеркладовым методам, а к интракладовым методам. Грубо говоря, он рассчитан для расчета только одной ветви. На приведенной Вами схеме 5 отдельных ветвей. Линейный метод подходит к расчету возраста каждой из этих ветвей. А общий возраст всех ветвей он дать не в состоянии. Судите сами: 188 гаплотипов разделены на 5 ветвей. Из них одна (ветвь № 3) состоит из 176 гаплотипов (93.6 %). Ветвь молодая. Вот она-то и утягивает оценку возраста линейным методом в сторону омоложения.
Далее. Из приведенной схемы следует, что из корня растет 3 ветви, а не 5. Поэтому расчет возраста общего предка надо делать для 3 ветвей.

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6229
  • Страна: ru
  • Рейтинг +1092/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #51 : 20 Ноябрь 2012, 18:19:37 »
Nimissin

То есть получается, что всё правильно и интеркладовый метод выборочных пар дал более адекватный результат 5,5-6 kyo?

Насчет трех ветвей. Визуально их действительно 3. Но я исходил из топологии снипов, а именно:
1 ветвь (слева) - L275+ M378-; тут видимое совпадает с невидимым. Это достаточно четкая ветвь Q1b*. Если кто-то из татар или пакистанцев решится на заказ WTY, то мы явно найдем общие новые снипы, характеризующие эту ветвь.
2 ветвь (видимая, центральная) реально распадается на четыре:
2.1 М378+ L245- (всего два казахских гаплотпа рода кожа, близкие родственники). Это Q1b1*.
2.2 М378+ L245+ (собственно вся Q1b1a-L245, внутри которой практически не найдено разделяющих этот массив снипов; стратификация велась по этно-географическим критериям)
2.3 М378+ P306+ новый снип, характеризующий часть индийских Q1b1
2.4 M378+ L301+ снип, характеризующий часть иранских Q1b1 (другая часть оказалась L245+ и L301-)
3 ветвь (справа) - один гаплотип M378+ L327+  португальского происхождения.
Итого 6 ветвей.
Собственно левая и правая ветви в комментариях не нуждаются.
А вот центральная у корня образует непонятное ветвление даже с учетом того, что снипам были присвоены четрехзначные веса.
А именно: сначала идет ответвление ветви 2.1, потом разделяется 2.2 и ветвь, делящаяся на 2.3 и 2.4. На этом фоне мелочью является подробность, что между ветвями 2.3 и 2.4 оказывается отросток, один гаплотип неизвестного происхождения (усыновленный), который М378+ P306- L301- L245- L327-.
При этом все  ветви кроме первой должны образовывать промежуточный узел (М378+) от которого в свою очередь разрастаться неким "пучком"...

Нужно ли было в таком случае обсчитывать две ветви?

Оффлайн VVR

  • ...
  • Сообщений: 2723
  • Страна: ua
  • Рейтинг +615/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Re: Обсуждения дерева Q (версия Шада)
« Ответ #52 : 20 Ноябрь 2012, 18:38:54 »
Для метода выборочных пар, если от предка, возраст которого мы оцениваем, отходит больше двух ветвей,то лучше свести дерево к двум ветвям. Такое упрощение, как было показано в нашей статье(Каржавин,Киреев и я) не изменяет результат оценки возраста. Тем более у Вас в.2 и3 объединены общим снипом.  Обсчитывать в данном случае надо - одна ветвь - 1, другая - (2+3).

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6229
  • Страна: ru
  • Рейтинг +1092/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #53 : 20 Ноябрь 2012, 19:20:08 »
Для метода выборочных пар, если от предка, возраст которого мы оцениваем, отходит больше двух ветвей,то лучше свести дерево к двум ветвям. Такое упрощение, как было показано в нашей статье(Каржавин,Киреев и я) не изменяет результат оценки возраста. Тем более у Вас в.2 и3 объединены общим снипом.  Обсчитывать в данном случае надо - одна ветвь - 1, другая - (2+3).

Пересчитал для двух ветвей (М378- и М378+).
number of mutations in own marker: ASDmvpmrk = 0,510490147375
При mr=0,00179 получается уже 7 kyo или 5100 лет до н.э.
Тысячу лет туда, тысяча лет сюда.... :)

А вообще правильно ли применять в данном слуачае эту mutation rate для 66 маркеров или нужно делать какую-то поправку?

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6229
  • Страна: ru
  • Рейтинг +1092/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #54 : 28 Декабрь 2012, 22:58:34 »

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6229
  • Страна: ru
  • Рейтинг +1092/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #55 : 02 Февраль 2013, 17:43:11 »
То же дерево, но загруженное с помощью нового сервиса.

Оффлайн Alexander

  • Сообщений: 669
  • Рейтинг +73/-0
  • Y-ДНК: J2b
Re: Обсуждения дерева Q (версия Шада)
« Ответ #56 : 02 Февраль 2013, 19:10:43 »
дерево, но загруженное с помощью нового сервиса
Со старым не сравнить, у меня всё размыто.

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6229
  • Страна: ru
  • Рейтинг +1092/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #57 : 02 Февраль 2013, 19:29:07 »
дерево, но загруженное с помощью нового сервиса
Со старым не сравнить, у меня всё размыто.

Жаль. Воспользовался рекомендацией уважаемого Митч Глитча. Для Мурочных "полотен" значит не подходит:(

Оффлайн пенелопа

  • Главный модератор
  • *****
  • Сообщений: 5637
  • Страна: ru
  • Рейтинг +1767/-12
  • мтДНК: H1b
Re: Обсуждения дерева Q (версия Шада)
« Ответ #58 : 02 Февраль 2013, 19:56:59 »
дерево, но загруженное с помощью нового сервиса
Со старым не сравнить, у меня всё размыто.
Кликнуть на ссылку, подождать, пока загрузится, "открыть в новой вкладке", нажать плюсик, выглядит замечательно, шрифт получается не меньше 10-12, все идеально разборчиво. Потом можно "сохранить как".

Оффлайн Alexander

  • Сообщений: 669
  • Рейтинг +73/-0
  • Y-ДНК: J2b
Re: Обсуждения дерева Q (версия Шада)
« Ответ #59 : 03 Февраль 2013, 15:40:25 »
Кликнуть на ссылку, подождать, пока загрузится, "открыть в новой вкладке", нажать плюсик, выглядит замечательно
Пожалуй, что так. Пропустил операцию "открыть в новой вкладке". Но без инструкции бы не догадался, спасибо.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100