АвторТема: Программа TNT.  (Прочитано 103542 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн I2a1a

  • ...
  • Сообщений: 10363
  • Страна: ee
  • Рейтинг +761/-8
Re: Программа TNT.
« Ответ #45 : 14 Октябрь 2009, 15:34:53 »
Оконечная вилка Киреев-Красильников одинакова во всех 3-х программах. Более нагладно в Нетворке - видна длина ветки Киреев.
Средняя часть одинакова в Филипе и в ТНТ (Шевченко-Ноздрин), у Нетворка - обратный порядок (Ноздрин-Шевченко).
Ядро, в общем-то одинаково у всех (если взять вар.№2 Нетворка).

Странно, что в ТНТ по графике не видно совпаденцев (Енгалычевых). Тут преимущество опять у Нетворка, хотя в нём помечается только один из совпаденцев, но кружок - большой - понятно.
Почему-то ТНТ по новой технологии объединил Жемкова-Енгалычева, хотя по цифрам ветвей видно, что не нужно бы.

Тут нет ничего странного, тем более на 12-17 маркерных гаплотипах. Ценную "генеалогическую" информацию из этого формата практически невозможно выудить.
Объяснение странностей очень простое - гомоплазия.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #46 : 14 Октябрь 2009, 15:53:36 »
Очень интересно, Александр. Цифры на ветвях -стоимость каждого линка. Как у Вас производился отбор деревьев? Обычно отбираются оптимальные по стоимости деревья.
А стоимость линка - это в чём? И зачем? Я полагал, что это как бы время до узлового предка.
Отбор производился не знаю как, все параметры оставлял по умолчанию. Куда нужно смотреть, чтобы ответить, как производился отбор?

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1390/-7
  • Ultimate Matriarchy
Re: Программа TNT.
« Ответ #47 : 14 Октябрь 2009, 16:03:16 »
Очень интересно, Александр. Цифры на ветвях -стоимость каждого линка. Как у Вас производился отбор деревьев? Обычно отбираются оптимальные по стоимости деревья.
А стоимость линка - это в чём? И зачем? Я полагал, что это как бы время до узлового предка.
Отбор производился не знаю как, все параметры оставлял по умолчанию. Куда нужно смотреть, чтобы ответить, как производился отбор?

поскольку Вы не задавали весов, это будет просто число изменившихся маркеров между смежными гаплотипами

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #48 : 14 Октябрь 2009, 16:19:07 »
поскольку Вы не задавали весов, это будет просто число изменившихся маркеров между смежными гаплотипами
Да, действительно похоже...Нужно ли было задавать веса (каждому маркеру?) и какие? Возможность там есть... А если задать, то числа могут быть и в годах-поколениях?

Оффлайн I2a1a

  • ...
  • Сообщений: 10363
  • Страна: ee
  • Рейтинг +761/-8
Re: Программа TNT.
« Ответ #49 : 14 Октябрь 2009, 18:04:35 »
Веса можно вычислить самому, можно использовать расчитанные веса 67-маркерного гаплотипа от wertnera. Веса нужны для анализа вероятности мутаций, и частично для анализа степени гомоплазии.

TNT не вычисляет "возраст" ветвей.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #50 : 15 Октябрь 2009, 13:20:42 »
Как у Вас производился отбор деревьев? Обычно отбираются оптимальные по стоимости деревья.
Построил дерево чуть сложнее (26 гаплотипов по группе I1-генофонда) и оценил вопрос уважаемого Vadim Verenich. По Traditional search ТНТ выдала аж 30 деревьев и все - best score. New technology, слава Богу, выдала "всего" 4 best дерева. Как теперь сделать выбор?
Попробовал сделать "consensus" или "super-tree", но получил нечто:
Strict consensus of 4 trees (0 taxa excluded)
   ??? SR5572Garin
   ?  ??? SH7734Alshinsky
   ?  ?  ??? SM8841Kireev
   ?  ?  ??? SP7384Vaganov
?-   ?   ??? SO9419Barahoev
   ?  ?  ??? SE5616Babin
   ?  ?  ??? SN8166Shtrunov
   ???  ??? SL8089Shtrunov
       ?  ??? SU8043Shtrunov
       ?  ??? SA0322Fazuljanov
       ?  ??? SC8314Skripka
       ?  ??? SN8854Semenov
       ?  ??? SK4192Olshansky
       ????? SI4127Mikerov
          ??? SS2334Krasilnikov
          ??? SB3711Kireev
          ?    ??? SG3978Sychev
          ?????? SV2651Skripka
          ?  ??? SW1511Fedjaev
          ????? SA3343Grigorjev
          ?  ??? SB1302Senotrusov
          ????? SH1633Senotrusov
          ?  ??? SC3356Serebrjany
          ?  ??? SR3494Bogdanov
          ???   ??? SY8234Otjutsky
              ?-???? SH1868Otjutsky
Можно, конечно, сравнить деревья с другими программами и выбрать похожее. Подскажите, как выбрать дерево в ТНТ?
Оцените теперь такие программы, как Филип-Мега - дают один вариант и никаких заморочек!
« Последнее редактирование: 15 Октябрь 2009, 14:08:21 от Alexander »

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #51 : 15 Октябрь 2009, 15:44:37 »
Зато группа Киреевых из genofond получилась супер! Мало того, что все субклады разделились, но даже I1-I2a определились в отдельную группу... Теперь бы сообразить, как покрасивее картинку сделать, по графике ТНТ сильно проигрывает Нетворку и Меге...
На рисунке - super tree=consensus tree (New Technology search выдал 3 варианта best trees).
                                Tree 3. min. branch lengths
   ???0 SH5294_G2a
   ?   ???4 SK6504_I2a
   ?   ???4 SU3649_I2a
   ?   ???4 SM8841_I1
   ?   ???6 SB3711_I1
? ?   ?     ???1 SU2492_J2b
   ?   ???5???4 SZ1241_H
   ?   ?        ???1 SA4946_T
   ?   ???3--?        ???2 SI3576_R1b
   ? 0?        ???2--???1 SA8847_R1b
        ?  ???2 SZ1399_N
        ?3?     ???2 SE1412_N
        ?  ???2???2 SH1892_N
        ?   ???2 SZ4764_R1a
        ?   ???5 SH5315_R1a
        ?   ???4 SF1845_R1a
        ? 6?      ???5 SW7880_R1a
             ?     ???0 SG6312_R1a
             ???2???4 SJ0667_R1a
                    ?     ???1 SF5955_R1a
                    ???2???1 SX8127_R1a

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1390/-7
  • Ultimate Matriarchy
Re: Программа TNT.
« Ответ #52 : 15 Октябрь 2009, 15:49:05 »
Цитировать
Оцените теперь такие программы, как Филип-Мега - дают один вариант и никаких заморочек!

Если есть серьезный интерес к древостроительству, то без заморочек не получится. Увы. Это не рутинная процедура.

Оффлайн I2a1a

  • ...
  • Сообщений: 10363
  • Страна: ee
  • Рейтинг +761/-8
Re: Программа TNT.
« Ответ #53 : 15 Октябрь 2009, 15:53:55 »
Выбранный Вами вариант с использованием consensus tree не отражает реальную топологию дерева. Консенсус-tree (компромиссная комбинация всех найденных деревьев) нужен только для определения достоверности отдельных ветвей.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #54 : 15 Октябрь 2009, 22:05:16 »
Выбранный Вами вариант с использованием consensus tree не отражает реальную топологию дерева.
А жаль, очень приятно выглядит по сравнению с другими результатами. Как же добраться до реальной топологии?

Оффлайн I2a1a

  • ...
  • Сообщений: 10363
  • Страна: ee
  • Рейтинг +761/-8
Re: Программа TNT.
« Ответ #55 : 15 Октябрь 2009, 22:19:21 »
А жаль, очень приятно выглядит по сравнению с другими результатами. Как же добраться до реальной топологии?

К сожалению, у меня нет однозначного ответа на этот вопрос. Можно найти самое оптимальное по стоимости дерево, но нет никаких гарантий, что оно будет достоверным в генеалогическом смысле этого слова ( а именно это Вас и интересует). Что тут можно посоветовать? Тестироваться на максимальное возможное количество Y-STR маркеров и  приватные SNP, затем анализировать каждое дерево с привлечением к анализу историко-географических данных.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #56 : 16 Октябрь 2009, 11:36:28 »
К сожалению, у меня нет однозначного ответа на этот вопрос. Можно найти самое оптимальное по стоимости дерево, но нет никаких гарантий, что оно будет достоверным в генеалогическом смысле этого слова ( а именно это Вас и интересует). Что тут можно посоветовать? Тестироваться на максимальное возможное количество Y-STR маркеров и  приватные SNP, затем анализировать каждое дерево с привлечением к анализу историко-географических данных.
Лично мне тестироваться, наверное, пока рано, так как я J2b2 и уже на 17 маркерах никаких приближенцев и близко не стоит. Так что 67 маркеров только сделает ситуацию более пессимистичной. Можно, конечно, на отдалённую перспективу...
Что до дерева, то хотелось бы построить пусть не достоверное, но достаточно приемлемое (и главное - наглядное) для хорошего комментария по результатам проекта. Пожалуй оптимальное по стоимости будет в самый раз, беда только, что таких best trees - определяется великое множество.
Видно, что ТНТ лучше других программ разделяет субклады, поэтому разумно будет поглубже в неё вникнуть.
Попробовал поизменять параметры обработки, некоторыми можно снизить число деревьев до 1. Например, в традиционном поиске можно отключить swapping algoritm=none (обменный алгоритм?) и при repls (числе доп. последовательностей?) до 10 - получается только одно дерево. Свыше 10 - два и более. При любом (из двух вар.) включении алгоритма - деревьев до сотни.
При ТНТ-поиске в режиме driven search (прогонном?) можно снизить число init. addseqs (начальных доп. последовательностей?) с 5 (при которых имеем 3 дерева) до 2 (одно дерево).
Верно ли будет пойти таким путём? Best score во всех случаях минимальный. Оптимальное по стоимости - это то же, что best score или что-то иное?

Оффлайн Centurion

  • 100% Earth (Solar System) genofond
  • Администратор
  • *****
  • Сообщений: 9543
  • Страна: ru
  • Рейтинг +572/-2
Re: Программа TNT.
« Ответ #57 : 16 Октябрь 2009, 12:22:43 »
Цитировать
Лично мне тестироваться, наверное, пока рано, так как я J2b2 и уже на 17 маркерах никаких приближенцев и близко не стоит. Так что 67 маркеров только сделает ситуацию более пессимистичной.
да ваш вариант больше тяготеет к востоку а не к балканам... а по тому региону вобще почти нет данных J2b2

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1390/-7
  • Ultimate Matriarchy
Re: Программа TNT.
« Ответ #58 : 16 Октябрь 2009, 13:45:02 »
Александр, с опциями экспериментировать не имеет смысла, дело в качестве самих данных. 17 локусов - это немногим лучше чем классификация людей по форме ушной раковины или даже ушных сережек :)

Оффлайн Аббат Бузони

  • ...
  • Сообщений: 19887
  • Страна: ru
  • Рейтинг +1823/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!
Re: Программа TNT.
« Ответ #59 : 16 Октябрь 2009, 14:21:51 »
Александр, категорически против таких мотивов в Вашей речи. Во-первых чем больше данных, тем ближе к истине, во-вторых часто бывает, что основное количество мутаций сосредоточено именно на первых 12-ти (17-ти) маркерах и поэтому делать 67 маркеров просто необходимо. Помяните мое слово.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.