АвторТема: Обсуждения дерева Q (версия Шада)  (Прочитано 27618 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #30 : 04 Июнь 2012, 20:55:48 »
Дерево Q1b-L275: разные версии от Мурки.

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #31 : 05 Июнь 2012, 21:53:22 »
Начата дискуссия по возможности калибровки данных для дерева - http://forum.molgen.org/index.php/topic,3916.msg143324.html#msg143324.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Обсуждения дерева Q (версия Шада)
« Ответ #32 : 05 Июнь 2012, 22:46:34 »
Дерево Q1b-L275: разные версии от Мурки.
Очень плохо видно, но похоже, что от корня дерева отходит три ветви - можно попробовать рассчитать МВП.

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #33 : 05 Июнь 2012, 23:05:31 »
Дерево Q1b-L275: разные версии от Мурки.
Очень плохо видно, но похоже, что от корня дерева отходит три ветви - можно попробовать рассчитать МВП.

Да... Убедился, что Гугл Плюс убило все изображение. Даже при скачивании ничего прочесть невозможно. Буду пробовать перезалить.
Ветвей там действительно несколько:
1) казахско-татарско-пакистанская
2) индо-иранская
3) основная, начинающаяся с упомянутых швейцарцев, после которых мы видим обширный ашеназский кластер и неашкеназский кластер (Хафф/Хофф).


Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Обсуждения дерева Q (версия Шада)
« Ответ #34 : 06 Июнь 2012, 10:29:16 »
Буду пробовать перезалить.
Ветвей там действительно несколько:
1) казахско-татарско-пакистанская
2) индо-иранская
3) основная, начинающаяся с упомянутых швейцарцев, после которых мы видим обширный ашеназский кластер и неашкеназский кластер (Хафф/Хофф).
А теперь слишком хорошо. Нужное место - ещё поискать по простыне. Действительно три ветви от корня с возрастом 5370+/-730 лет. Попробуйте МВП с теми же константами. Рекомендовал бы ещё картину дерева сопровождать некими общими характеризующими параметрами (общее число гаплотипов (источники данных), количество основных ветвей с указанием числа гаплотипов в них, mrate, продолжительность жизни поколения, укоренение, число вариантов раскладки и обоснование выбора).

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Обсуждения дерева Q (версия Шада)
« Ответ #35 : 10 Июнь 2012, 20:00:03 »
Ветвей там действительно несколько:
1) казахско-татарско-пакистанская
2) индо-иранская
3) основная, начинающаяся с упомянутых швейцарцев, после которых мы видим обширный ашеназский кластер и неашкеназский кластер (Хафф/Хофф).
Просмотрел дерево. Интерес был, в основном, по генеалогиям. Кстати, ещё раз убедился в преимуществе картинки ТНТ перед Муркой. Дерево ТНТ даётся в редакторе, и найти нужный гаплотип среди любого их числа - поиском - в одно касание. В .png-Мурки сломаешь глаза, а 100% толка не добъёшься.
Что имею в виду.

Неплохо выглядит участок Хоффов, Корневой их предок (169897/172691) на 270 годах выглядит вполне убедительно. Однако не нашёл 213826, который был приведён в Вашей выборке. Есть пара увеличенных "кружков" (совпаденцев) с одними и теми же номерами - вопрос, что это? Может быть там и искомый номер затерялся? Или - неудобство поиска в .png + плохое зрение.
Попробовал посчитать этих Хоффов МВП - даёт чересчур завышенный возраст, даже не буду приводить, что-то не то и нужно разбираться.
А какие константы были при расчёте Вашего Ро-возраста (mrate & T generate)?
По Шакке. Это молодая генеалогия (1720) и странно видеть её в самом корне всего дерева. №137432 на 4190 лет! Сидят они нормально - компактно, как и положено, но тысячные TMRCA... может опять я что-то недопонял? Опять же, не отыскал Шакке №N63229.
Прокомментируете?
« Последнее редактирование: 10 Июнь 2012, 20:06:37 от Alexander »

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #36 : 12 Июнь 2012, 18:50:17 »
Ветвей там действительно несколько:
1) казахско-татарско-пакистанская
2) индо-иранская
3) основная, начинающаяся с упомянутых швейцарцев, после которых мы видим обширный ашеназский кластер и неашкеназский кластер (Хафф/Хофф).
Просмотрел дерево. Интерес был, в основном, по генеалогиям. Кстати, ещё раз убедился в преимуществе картинки ТНТ перед Муркой. Дерево ТНТ даётся в редакторе, и найти нужный гаплотип среди любого их числа - поиском - в одно касание. В .png-Мурки сломаешь глаза, а 100% толка не добъёшься.
Что имею в виду.

Неплохо выглядит участок Хоффов, Корневой их предок (169897/172691) на 270 годах выглядит вполне убедительно. Однако не нашёл 213826, который был приведён в Вашей выборке. Есть пара увеличенных "кружков" (совпаденцев) с одними и теми же номерами - вопрос, что это? Может быть там и искомый номер затерялся? Или - неудобство поиска в .png + плохое зрение.
Попробовал посчитать этих Хоффов МВП - даёт чересчур завышенный возраст, даже не буду приводить, что-то не то и нужно разбираться.
А какие константы были при расчёте Вашего Ро-возраста (mrate & T generate)?
По Шакке. Это молодая генеалогия (1720) и странно видеть её в самом корне всего дерева. №137432 на 4190 лет! Сидят они нормально - компактно, как и положено, но тысячные TMRCA... может опять я что-то недопонял? Опять же, не отыскал Шакке №N63229.
Прокомментируете?

Уважаемый Alexander! Большое спасибо за интерес проявленный к моей, забытой Богом, гаплогруппе:)
Только вернулся с гор - поэтому откомментирую с ходу то что смогу.
1. Мурка может выдавать дерево в текстовом формате. Пишите на ЛС свой емэйл и я перешлю Вам соответствующие файлы. К сожалению, пока не научился их публиковать в удобочитаемом виде. Полагал, что графика более наглядна. Вижу, что это нет так.
2. Ро я брал равным 150 (по рекомендации уважаемого Valery, как я уже писал). В принципе, получилось адекватно. Соответственно при mutation rate 0,002784 это дает T generate = 28.
3. По Шакке. IMHO, филогенетичекое древо показывает не дату формирования ветви саму по себе, а ее возраст относительно других. Это и вывело достаточно молодую швейцарскую ветвь в корень гаплогруппы Q1b-L275. Я это интерпретирую так. Предки этого семейства были первыми европейскими Q1b, которые отделились от чисто азиатских ветвей. В корне там серьезно намешано. Или картина со временем прояснится, или мы действительно имеем нелокализуемый разброс гаплотипов от Малой Азии до Центральной Европы.
4. Упомянутые гаплотипы отсутствуют у меня в исходном *ych файле. Если так, то я их скорее всего убрал из выборки как полностью совпадающие гаплотипы. Т.е. на 67 маркерах они не имели различий с каким-то другим гаплотипом, который остался в выборке.
« Последнее редактирование: 12 Июнь 2012, 19:19:40 от Шад »

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Обсуждения дерева Q (версия Шада)
« Ответ #37 : 12 Июнь 2012, 20:26:33 »
2. Ро я брал равным 150 (по рекомендации уважаемого Valery, как я уже писал). В принципе, получилось адекватно. Соответственно при mutation rate 0,002784 это дает T generate = 28.
Тут, как я уже писал в теме про калибровку, расклад другой: Это Ро получается из 25/0.0025/67 = 149.25 ( то есть, на Вашем Q-tree mrate=0,0025, Tg=25 years). Хотя Ро - это основной показатель (по этой причине он и заложен в дистрибутив), а вариантов "раскадровки", как видим, множество.
По Шакке. IMHO, филогенетичекое древо показывает не дату формирования ветви саму по себе, а ее возраст относительно других.
. Вообще-то, как раз - возраст, рассчитанный по rho, должен соответствовать в пределах погрешности, ну хотя бы порядок... И даже в случае "относительно других", получается, что Шакке - предки Хоффов?

Е-мэйл, сейчас вышлю, буду весьма благодарен за дерево в редакторе. Но не припомню, чтобы этот вариант отображения был рекомендован в мануале "дилетанта" в мурочной теме. Ссылка была бы полезна заинтересованным товарищам...

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #38 : 12 Июнь 2012, 20:58:15 »
Но не припомню, чтобы этот вариант отображения был рекомендован в мануале "дилетанта" в мурочной теме. Ссылка была бы полезна заинтересованным товарищам...

В дистрибутиве есть файл runych2rdf.bat. В нем с ключем -G есть возможность вывода в графике:
-G "TRDF; 4; ROOTPREFERRED|CHCHNG|DIST|TXNAMES|CHNAMES|ROOTONLY|TREEONLY|NOSEQ|NOPOOL|MPPART|AGE; 4; 3; 0.0; 0.0; ; ; ; ; nw#.txt; ; ; viz\tpl\n1extra.txt; "

Если нужно в GV, то должно быть так:
-G "GraphViz; 1; ROOTPREFERRED|CHNAMES|CHCHNG|TXNAMES|TXFRSZ|TXCD|ROOTONLY|TREEONLY|CALL|NOPOOL|MPPART; 1.8; 1.1; 0.1; 2.0; 96.0; png; C:\gv\bin\dot.exe; C:\gv\bin\circo.exe; viz\nw#.dot; viz\nw#.png; viz\tpl\nwtpl.txt; viz\tpl\exaextra.txt; "

В первом случае формируются текстовые файлы, которые можно просматривать и редактировать в блокноте.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Обсуждения дерева Q (версия Шада)
« Ответ #39 : 12 Июнь 2012, 21:57:18 »
В дистрибутиве есть файл runych2rdf.bat. В первом случае формируются текстовые файлы, которые можно просматривать и редактировать в блокноте.
Спасибо, только у меня (и тоже в дистрибутиве) - это в файле runmjstrgv.bat (и текст немножко другой, но смысл такой же) - подзабыл малость.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Обсуждения дерева Q (версия Шада)
« Ответ #40 : 13 Июнь 2012, 09:56:59 »
.. филогенетичекое древо показывает не дату формирования ветви саму по себе, а ее возраст относительно других. Это и вывело достаточно молодую швейцарскую ветвь в корень гаплогруппы Q1b-L275. Я это интерпретирую так.
Возможно, что в этом Вы приближаетесь к верному толкованию (про место на дереве, а не про возраст). Нашёл рассуждение на "родстве" о медианных алгоритмах: http://www.rodstvo.ru/forum/index.php?showtopic=1500&st=680&p=76140&#entry76140. Суть его в том, что программы типа Нетворк, Мурка (с графическим представлением дерева в виде медианной  сети) отличаются от классических филпрограм (Филип, ТНТ, на деревьях которых гаплотипы расположены в концах веточек). Алгоритм Мурки основан на оптимизации сети, составленной из медиан, попарно соединяющих гаплотипы. Медианные точки внешне ассоциируются с предками, что сбивает с толку тех, кто не в курсе (это про меня). На самом деле это математическая абстракция. Задача программы - найти кластеры (они на Вашем дереве определились). Всё остальное, включая Ро-возрасты, из другой оперы. В Нетворке есть опция, позволяющая найти Ро-возраст для конкретного кластера (без учёта его места на общем дереве). Про Мурку пока не скажу, нужно узнавать.

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #41 : 13 Июнь 2012, 22:02:14 »
Процитирую автора Мурки (с его согласия):
Цитировать
возраст клестеров в Мурке висит лейблом возле каждого внутреннего узла :)

а что касается отличий алгоритма то пользователь этого НЕ ВИДИТ. Формально это парсимония, а как реализовано внутри - ну какая разница? Мурка = Нетворк + штейнер нетворка, в мурке опции запуска того и другого комбинированы. Она дает на выходе и медианы и деревья из них. Ее можно сравнивать с нетворком только при условии что в нетоврке запущен штейнеровский постпроцессинг.

Цитировать
Итак, что я заметил по прочтении поста Александра - это определенное непонимание сути алгоритмов. Даже не в сути, а в некоем интерфейсе между разными типами алгоритмов, что еще поверхностней и важнее. Медианные точки - это разновидность Штейнеровских точек, а именно те штейнеровские точки которые достижимы как результат последовательного применения медианных операций к множеству исходных гаплотипов. Точные версии медианных алгоритмов (Murka/Network MJ with high Epsilon value, Murka MJ with Epsilon = -1, Murka FN) дозволяют находить медианным путем ВСЕ Штейнеровские точки. Эвристики (Murka/Network MJ with low/zero Epsilon value, Murka MJ with WPHEUR) находят достаточно много штейнеровских точек. После MP-постпрцессинга который выдирает из сети штейнеровские деревья, медианная суть этих точек  совершенно не важна. Какая разница как получены деревья? Важно какова их стоимость, в смысле сколь сильно отличается от оптимальной, сколько этих деревьев, как они различаются, расстояния между ними итп. Мурка умеет скрывать медианное происхождение реконструированных ею предковых узлов. Нетворк - не умеет, но это можно как-то компенсировать в умелых руках :) Я не виноват, что данные вопросы остаются без внимания конечного пользователя. Но когда я сам писал Мурку, для меня это было важной задачей - как методами, сходными с Нетворковыми, получить результат в том же контексте в котором находятся результаты традиционных программ. Потому и ввел топологии, расстояния между топологиями итп. В нетворке этого нет. Не моя вина :) Так, если честно, я стесняюсь внутреннего родства Мурки и Нетворка, уж очень небрежен был автор флаксусовского софта. Там масса вещей которые на поверхность выходить не должны вообще!

ЗЫ. Кстати у Александра есть хорошая совместная с Каржавиным статья где изучались древа ТНТ и Мурки. Мои благодарности :)

Обращаю также внимание на то, что стараниями поклонников у Мурки появилась страничка на Facebook: https://www.facebook.com/phylomurka

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Обсуждения дерева Q (версия Шада)
« Ответ #42 : 14 Июнь 2012, 14:11:29 »
Процитирую автора Мурки (с его согласия):возраст клестеров в Мурке висит лейблом возле каждого внутреннего узла :)
С авторитетами приходится соглашаться, а главное. как-то учиться. Согласен, что сравнение алгоритмов было не удачным. Это так, действительно:
Какая разница как получены деревья?
Говоря о схожести Нетворка и Мурки я имел в виду  лишь графическое представление дерева, в котором гаплотипы находятся не только на концах веток, а также и в узловых точках, создавая впечатление "предков".
Должно же быть какое-то объяснение того, что кластер Шакке, оказавшись в узловых точках корневой зоны дерева, обозначился лейблом в 4000 лет?
Благодарен за поправку и обращаюсь к автору Мурки с просьбой прокомментировать сей непонятный мне момент.

Оффлайн mouglley

  • ...
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Re: Обсуждения дерева Q (версия Шада)
« Ответ #43 : 14 Июнь 2012, 15:42:18 »
Да, было бы замечательно, если бы Мурка не использовала гаплотипы ныне живущих людей в качестве узлов.

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Обсуждения дерева Q (версия Шада)
« Ответ #44 : 14 Июнь 2012, 16:22:03 »
Процитирую автора Мурки (с его согласия):возраст клестеров в Мурке висит лейблом возле каждого внутреннего узла :)
С авторитетами приходится соглашаться, а главное. как-то учиться. Согласен, что сравнение алгоритмов было не удачным. Это так, действительно:
Какая разница как получены деревья?
Говоря о схожести Нетворка и Мурки я имел в виду  лишь графическое представление дерева, в котором гаплотипы находятся не только на концах веток, а также и в узловых точках, создавая впечатление "предков".
Должно же быть какое-то объяснение того, что кластер Шакке, оказавшись в узловых точках корневой зоны дерева, обозначился лейблом в 4000 лет?
Благодарен за поправку и обращаюсь к автору Мурки с просьбой прокомментировать сей непонятный мне момент.

от автора:
Цитировать
Ну, вообще говоря, бывают очень архаичные гаплотипы. Бывают и ложно-архаичные за счет серии обратных изменений. А бывают просто ошибочные деревья. Огромная ветвь справа может на самом деле должна расти не из реального гаплогтипа а где-то рядом. На ТНТ посмотрите, там бывают аналогичные "лесенки". Только ОБЯЗАТЕЛЬНО возьмите у Овода скрипт с разметкой мутаций! Посмотрите, ув. Александр на прикорневые ветки без мутаций, и тогда можно вернуться не только к разговору о Мурке vs ТНТ, но и вообще о степени надежности реконструкций выдающих таких живых динозавров 20 века )

И от себя. Я может быть пока не такой продвинутый пользователь, но немного не понимаю сути вопроса. В любом случае мы анализируем гаплотипы ныне живущих (или живших недавно людей). И если один гаплотип или группа оказывается в корне дерева, то я это рассматривают как оценку их возраста (местоположения на дереве) относительно других гаплотипов. Таким образом, кластер  Shockey (или CE по моей классификации) в данной версии дерева имеет возраст (точку расхождения с другими ветвями) более 4000 лет. А средний возраст кластера будет совсем другой - если его просчитать изолировано от остальных гаплотипов, то он будет соответствовать датам жизни их исторического предка. Наверное. Нужно бы проверить:)

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.