АвторТема: Какая программа лучше всего годится для построения древ?  (Прочитано 13512 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Впрочем, думаю, что все у Вас получится, ув. ШАД. Судя по Вашей митогруппе, Вы наш человек, полный энергии и решимости довести дело до конца.

Оффлайн Centurion

  • 100% Earth (Solar System) genofond
  • Администратор
  • *****
  • Сообщений: 9548
  • Страна: ru
  • Рейтинг +571/-2
Впрочем, думаю, что все у Вас получится, ув. ШАД. Судя по Вашей митогруппе, Вы наш человек, полный энергии и решимости довести дело до конца.
Падаван  :D

Оффлайн Nimissin

  • Сообщений: 2403
  • Рейтинг +759/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Кто-нибудь выскажется в защиту (точнее, в апологию) Network'а?

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Кто-нибудь выскажется в защиту (точнее, в апологию) Network'а?

Простой интерфейс. Наглядная графика. Хоть и требующая временами нудного "расчёсывания".
 
Алгоритмически проигрывает Мурке, особенно в части быстродействия и извлечения деревьев из сети (задача Штайнера).

Оффлайн Nimissin

  • Сообщений: 2403
  • Рейтинг +759/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
А что обратило Ваш взор, уважаемый Овод, на программу TNT? Чем она лучше Network'a?

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
А что обратило Ваш взор, уважаемый Овод, на программу TNT? Чем она лучше Network'a?

Наилучшим среди известных программ быстродействием. Широким выбором эвристик поиска. Но главное - возможностью "встраивания" в нее собственных модулей анализа полученных деревьев.
 
Недостатки: отсутствие наглядной графики. Необходимость существенного филогенетического "образования" для задания оптимальной стратегии поиска и интерпретации результатов в конкретных случаях.

Оффлайн Nimissin

  • Сообщений: 2403
  • Рейтинг +759/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Спасибо за помощь.

Оффлайн mouglley

  • ...
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Network рушится при обработке базы среднего размера.
У меня были проблемы при обсчёте 150 гаплотипов 67.

Как было сказано, расчёсывание занимает 95 времени ведения дерева гаплогруппы.

К тому же, уважаемый Овод умеет писать скрипты к TNT (что не каждый умеет).
С его скриптами программ выдаёт результаты (топологию), которые трудно оспорить.

Прекрасные алгоритмы расчётов (очень быстрые).
Если бы кто-нибудь создал скрипт для вывода результатов в формат *.dot, который можно в последствии использовать для отличной графики, то TNT сильно бы облегчила нашу жизнь.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6335
  • Страна: ru
  • Рейтинг +1333/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Шад, повторюсь: начинайте использовать TNT. Иначе просто потеряете время на освоение PHYLIP.

Что же касается использования в выборке коротких гаплотипов наряду с длинными, то недавно произошел такой случай.
На дерево E1b1b1a1b-V13, состоящее из более четырехсот 67-маркерных гаплотипов по просьбе Сергея Лутака я добавил один 37-маркерный итальянский гаплотип, близкий к гаплотипу Сергея. Этот 37-маркерный гаплотип сразу же перетащил гаплотип Сергея на другую ветвь. Затем, через некоторое время, итальянец сделал 67 маркеров. При обновлении дерева итальянец остался на той же ветви, а Сергей вернулся на свою старую ветвь.
Дерево E1b1b1a1b-V13 "плотное": достаточно молодой общий предок, много протестированных. На него подействовало даже столь маленькое (0,25% выборки) добавление короткого гаплотипа. В более "разреженных" влияние будет меньше.
Еще один фактор: я дерево делал в своей самописной программе, может быть она такая неустойчивая.

Имхо, самый правильный подход: в качестве основного дерева держать 67-маркерное. И в качестве изучения выборки делать еще дерево с гаплотипами разной длины (TNT позволяет) и анализировать его на появление обособленных ветвей из коротких гаплотипов, но не особо обращать внимание на его разделение ветвей в "плотной" части.

Вадим, сегодня осознал справедливость Вашей рекомендации по ТНТ. Phylip при изменении состава выборки (убираю один-два гаплотипа для проверки стабильности дерева или строю дерево для группы близких гаплотипов для подтверждения стабильности выявленной ветви) постоянно перекидывает некоторые гаплотипы "с ветки на ветку"... Или это дефект не программы, а выборки? Или дело в пользователе? :)
И ещё. Я конечно осознаю, что расчеты с сайта FTDNA это не истина в последней инстанции, но считаю их чем то вроде "отраслевого стандарта де-факто". А по моим построениям два человека, которые мне наиболее близки по дистанции по 67 маркерам оказываются дальше по дереву, чем другие гаплотипы. И при расчете в Y-Utility с выбором Mutation Rate по FTDNA (0.004..0.0075) у меня не получается совпадения по Probability с моими ближайшими совпаденцами в Y-Matches (выходит разница +/-2 поколения).

Оффлайн wertner

  • ...
  • Сообщений: 1332
  • Страна: ru
  • Рейтинг +321/-0
    • YFull
  • Y-ДНК: E-V13->E-S2972->E-Z16661
  • мтДНК: U4a (xU4a3)
Вадим, сегодня осознал справедливость Вашей рекомендации по ТНТ. Phylip при изменении состава выборки (убираю один-два гаплотипа для проверки стабильности дерева или строю дерево для группы близких гаплотипов для подтверждения стабильности выявленной ветви) постоянно перекидывает некоторые гаплотипы "с ветки на ветку"... Или это дефект не программы, а выборки? Или дело в пользователе? :)
Это случается в любых программах.
Для получения достоверной филогенетической информации используйте "консенсус"-деревья.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6335
  • Страна: ru
  • Рейтинг +1333/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Я правильно понимаю, что ТНТ и Phylip анализируют принципиально разные вещи? Файл *.ych содержит перечень STR-маркеров и повторов по каждому маркеру. А файл данные для Phylip содержит TMRCA в попугаях годах или поколениях. Т.е. ТНТ анализирует первоисточник, а Phylip - обработанные данные. В результате во втором случае дерево может искажаться из-за того, что сам расчет TMRCA носит вероятностный характер.

Оффлайн mouglley

  • ...
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Да, суть именно в этом.

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
В результате во втором случае дерево может искажаться из-за того, что сам расчет TMRCA носит вероятностный характер.

у ТНТ тоже можно сказать расчет имеет вероятностный характер хотя парсимонию обычно с вероятностным подходом не связывают, как и нейбор по которому работает филипка. Просто нейбор, как Вы уже заметили, подходит к делу более опосредовано и принципиально проще.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.