АвторТема: Построение дендограмм (графиков, схем, деревьев) гаплогруппы  (Прочитано 54245 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Аналогия не вполне чистая. Но представьте что речь идёт не о двух точках, а о нескольких. И не на плоскости, а в пространстве.
Другой аспект - вероятностный. Имеем какое-то среднее значение и выбросы. (Любимый пример - лотерея. Средняя доходность вложения 0.75 доллара на каждый вложенный доллар, но кто-то имеет 10, 50, 100, и даже десятки миллионов долларов.)
Признаю, что математический смысл есть. Но физический смысл - это где-то и есть здравый смысл. А с ним - всё-таки что-то не то. Представьте, что речь идёт не о точках, а о конкретном прародителе группы. И у группы из 10 человек, он моложе, чем у тройки из той же группы. Я бы отнёс такие случаи в особые. Тем более, что в моём конкретном случае из 15 вариантов группировок медианное значение превышено только в двух (13%). И в них уже 8 из 17 с низкими пиковыми вероятностями можно считать запограничными. А остальные 13 вариантов вполне приемлемы.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Александр,

Смотрим по-простому.
Мы выбираем медианную генетическую разницу. Стало быть у половины выборки генетические дистанции больше. Т.е. и расстояние до общего предка.
А у второй половины меньше.

Оффлайн napobo3

  • Сообщений: 1257
  • Страна: il
  • Рейтинг +348/-2
  • Y-ДНК: J-FGC5231
  • мтДНК: N1b2
Спасибо за подробное объяснение! Хочу добавить, что вместо выделения данных в таблице Ysearch я использую автоматические средства - скрипт Теда Канделя, позволяющий сохранить содержание таблицы в .ych файл. Меньше мороки и нет риска ошибок - типа рука дрогнула при выделении/копировании.
http://mycroft.mozdev.org/search-engines.html?name=ysearch.org

Оффлайн asan-kaygy

  • ...
  • Сообщений: 9609
  • Страна: kz
  • Рейтинг +945/-5
  • Y-ДНК: R1a1a1b2a1a-L657+,Y9+,Y944+
Насколько дендограммы кластерного анализа из программы Статистика 7.0. отличаются от дендограмм из специального софта для популяционной генетики. Есть ли отличия в методах разделения ветвей или вообще это разные методы вообще.

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Насколько дендограммы кластерного анализа из программы Статистика 7.0. отличаются от дендограмм из специального софта для популяционной генетики. Есть ли отличия в методах разделения ветвей или вообще это разные методы вообще.

Зачем задавать один и тот же вопрос в разных темах одновременно?
 
на него уже было отвечено: http://forum.molgen.org/index.php/topic,521.msg33708.html#msg33708

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Вопрос по Филипу - подскажите, где скачать инструкцию?
В частности хотелось бы понять, как манипулировать установками: мощностью, randomize input order, и прочими. Знаю, что неактуально, но может, кто вспомнит?

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
По Филипкиной страничке уже поползали?
***Начать рассматривать ссылки с описаний методов.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
По Филипкиной страничке уже поползали?***Начать рассматривать ссылки с описаний методов.
Спасибо. Сам бы дошёл, но не быстро.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Можно ли Y-Utility (http://www.mymcgee.com/tools/yutility111.html) использовать для анализа данных с разным количеством маркеров? Или для анализа необходимо нормировать данные по гаплотипу с минимальным количеством маркеров?

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Да, нужны гаплотипы одной длины.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Есть метод, обратный описанному Вами. Он называется  bootstrap analysis, только в нем не добавляют гаплотипы в выборку, а наоборот, изымают из выборки произвольные гаплотипы. Этот метод реализован, в частности, в одной из филоутилит в пакете Phylip.  С его помощью оценивают надежность той или иной ветви древа.

Ув. mouglley этим каждый день занимается на практике с реальными гаплотипами. Он может поделится с Вами на основании своего сугубо эмпирического опыта информацией о том, как меняется выборка из 67 маркерных гаплотипов с добавлением каждого нового гаплотипа.

Цитировать
Bootstrapping is a way of testing the reliability of the dataset. It is the creation of pseudoreplicate datasets by resampling. Bootstrapping allows you to assess whether the distribution of characters has been influenced by stochastic effects. In phylogenetic analyses nonparametric bootstrapping is the most commonly used method. The pseudoreplicate datasets are generated by randomly sampling the original character matrix to create new matrices of the same size as the original. The frequency with which a given branch is found is recorded as the bootstrap proportion. These proportions can be used as a measure of the reliability (within limitations) of individual branches in the optimal tree.

Thus bootstrap analysis:

    * is a statistical method for obtaining an estimate of error
    * is used to evaluate the reliability of a tree
    * is used to examine how often a particular cluster in a tree appears when nucleotides or aminoacids are resampled



Можно ли также популярно как в начале описано применение утилиты fitch дать описание утилиты neighbor для bootstrap analysis?

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
fitch в файле вывода результатов (outаfile) выдает строчку: this is an unrooted tree!
Это характеризует выборку (т.е. отсутствие в ней явного предкового гаплотипа) или можно поменяв опции добиться формирование дерева с предковым (или хотя бы самым старшим во возрасту гаплотипом)?
Или же этого можно добиться только путем манипуляций с исходными данными, ставя в первую строчку гаплотип наиболее удаленный по времени от модала (по TMRCA)?

UPD: Вроде бы сам нашел ответ на свой вопрос. В Меге нужно выбирать опцию View| Root on midpoint.
« Последнее редактирование: 12 Июнь 2011, 19:02:58 от Шад »

Оффлайн futurator

  • Сообщений: 25
  • Страна: ru
  • Рейтинг +1/-0
Такой вопрос: в PHYLIP Fitch какой Power выставлять при расчетах?

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.