АвторТема: Реконструкция филогенетического дерева NO по 76 STR-локусам  (Прочитано 13234 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн mouglley

  • Модератор
  • *****
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Я бы порекомендовал "реконструировать" укоренное дерево (rooted tree).
Фактически это дерево близко к укоренённому, в случае, если уважаемый Dimitri использовал гаплотип предка NO, найденный уважаемым Wertner.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Далее, я бы порекомендовал использовать входящий в стандартный пакет TNT скрипт aquickie.run. Этот скрипт позволяет ...
Ух ты!
Вот за это, Вадим я и люблю Мурку.
Результат нагляден и достижим простым действием - безграничным доверием профессионализму уважаемого Valery.

Ну так ведь частоту наличия партиции (mpt) в каждом найденном в Мурке MP-древе можно определить и в Мурке - предварительно задав нужные параметры в строке параметров запуска Мурке.  По этой частоте можно также строить предположения о филогенетической надежности ветви (т.е вероятности предковой мутации, приведшей к образованию конкретной ветви в конкретном мурковском дереве).

 :)

Но Мурка (надеюсь, что только пока) не позволяет производит бутстрэп-анализы и анализ бремеровской поддержки ветви.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Я бы порекомендовал "реконструировать" укоренное дерево (rooted tree).
Фактически это дерево близко к укоренённому, в случае, если уважаемый Dimitri использовал гаплотип предка NO, найденный уважаемым Wertner.

Очень хорошо, что TNT-дерево близко к укорененному на предковый гаплотип NO дереву. Однако, на основании своего небольшого  2-летнего опыта филогенетических реконструкций в разных программах, я бы все-таки рекомендовал использовать для укоренения гаплотип-outgroup, - т.е., гаплотип, который заведомо принадлежит к парафилетической ветви, т.е не входит во множество NO гаплотипов.  Нужно помнить о том, что большинство предковых (модальных, медианных и др.)  гаплотипов, особенно у супергрупп (NO, IJ, P) представляют собой наиболее вероятные реконструкции предковых значений локусных значений маркеров. В то время как гаплотип-outgrup представляет собой реально существующий гаплотип. Исходя уже из этого, можно считать, что для Y-STR филогений метод ougroup-укоренения наиболее надежен.

Оффлайн DimitriАвтор темы

  • Сообщений: 414
  • Страна: ru
  • Рейтинг +96/-0
  • Y-ДНК: N-Y9022>Y41021 [RU-KO] ЖМ: R1a-M458>FTB20451 [RU-BEL] МЖМ: C-M48>B80 [RU-ZAB]
  • мтДНК: HV9b1* [RU-SAR]
Ув. Дмитрий,

Как всегда, отличный анализ.
Я хотел бы поинтересоваться, какие параметры поиска MP-деревьева Вы используете в TNT? И каким образом Вы кодируете  DYS-маркерные аллели - как аддитивные или как дискретные признаки?

Благодарю за положительную оценку.
Я использую New Technology Search, в "Driven search" устанавливаю "set initial level" в 100 (т.е. на максимум), затем поднимаю "Init. addseqs" до 50 (на большее в моем ноутбуке памяти не хватает). Больше ничего не меняю.
Аллели кодируются как аддитивные - в приложенном файле есть строка "ccode + . ;"

Лично я использую утилиту, написанную ув. Игорем (Ovod). Она кодирует аллели, и записывает кодированные признаки в виде массива аддитивных признаков. Но если я верно помню,  в этой утилите есть ограничение по количеству маркеров =< 67 маркеров.

Я готовлю данные с помощью Excel: определяю минимальное значение по каждому маркеру в выборке, вычитаю его, перевожу в шестнадцатиричныую систему.

Далее, я бы порекомендовал использовать входящий в стандартный пакет TNT скрипт aquickie.run.

Благодарю за совет, уже запустил, о результатах расскажу.

Оффлайн DimitriАвтор темы

  • Сообщений: 414
  • Страна: ru
  • Рейтинг +96/-0
  • Y-ДНК: N-Y9022>Y41021 [RU-KO] ЖМ: R1a-M458>FTB20451 [RU-BEL] МЖМ: C-M48>B80 [RU-ZAB]
  • мтДНК: HV9b1* [RU-SAR]
Я бы порекомендовал "реконструировать" укоренное дерево (rooted tree). Для этого необходимо в качестве первого таксона задавать парафилетический гаплотип (гаплотип, заведомо не входящий в массив всех остальных  и образующий паралелльную ветвь). В данном случае строится дерево NO, поэтому в качестве гаплотипа-outgroup лучше всего брать  любой 76 маркерный гаплотип из M-P256, S-    M230,P202, P204    или P-M230. Я не знаю, имеется ли 76 маркерный гаплотип в первых двух группах, но в наиболее протестированной группе P-M230 таковые точно имеются.
Задачи определить корень NO я перед собой не ставил. Мне нужен был корень N (ну и из-за симметрии получилось найти корень O). Для этого существующей выборки достаточно.

Оффлайн DimitriАвтор темы

  • Сообщений: 414
  • Страна: ru
  • Рейтинг +96/-0
  • Y-ДНК: N-Y9022>Y41021 [RU-KO] ЖМ: R1a-M458>FTB20451 [RU-BEL] МЖМ: C-M48>B80 [RU-ZAB]
  • мтДНК: HV9b1* [RU-SAR]
И последняя, но важная рекомендация.
Оценку возраста ветвей по ро-статистике мутаций можно производить с помощью скрипта Овода (rho.run).
Пробовал я его запускать, но пока ничего хорошего не получается. Есть подозрение, что он не рассчитан на работу с галотипами, в которых значения некоторых маркеров неизвестны. Поспрашиваю еще у автора, как он появится на форуме.

У меня есть другая мысль - посчитать в Excel времена расхождения веток на этом дереве по методу Нортведта. Для этого, как я понимаю, неполные гаплотипы вполне подойдут.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
И последняя, но важная рекомендация.
Оценку возраста ветвей по ро-статистике мутаций можно производить с помощью скрипта Овода (rho.run).


Пробовал я его запускать, но пока ничего хорошего не получается. Есть подозрение, что он не рассчитан на работу с галотипами, в которых значения некоторых маркеров неизвестны. Поспрашиваю еще у автора, как он появится на форуме.

Нет, его скрипт работает и с неполными "гаплотипами".

Цитировать
У меня есть другая мысль - посчитать в Excel времена расхождения веток на этом дереве по методу Нортведта. Для этого, как я понимаю, неполные гаплотипы вполне подойдут.

Очень хорошо. Неполные гаплотипы и здесь подойдут.
Буду ждать результатов.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Я бы порекомендовал "реконструировать" укоренное дерево (rooted tree). Для этого необходимо в качестве первого таксона задавать парафилетический гаплотип (гаплотип, заведомо не входящий в массив всех остальных  и образующий паралелльную ветвь). В данном случае строится дерево NO, поэтому в качестве гаплотипа-outgroup лучше всего брать  любой 76 маркерный гаплотип из M-P256, S-    M230,P202, P204    или P-M230. Я не знаю, имеется ли 76 маркерный гаплотип в первых двух группах, но в наиболее протестированной группе P-M230 таковые точно имеются.
Задачи определить корень NO я перед собой не ставил. Мне нужен был корень N (ну и из-за симметрии получилось найти корень O). Для этого существующей выборки достаточно.

Вы неправильно поняли мою мысль. Речь шла не об определении корня NO, а о методе укоренения дерева.

Оффлайн DimitriАвтор темы

  • Сообщений: 414
  • Страна: ru
  • Рейтинг +96/-0
  • Y-ДНК: N-Y9022>Y41021 [RU-KO] ЖМ: R1a-M458>FTB20451 [RU-BEL] МЖМ: C-M48>B80 [RU-ZAB]
  • мтДНК: HV9b1* [RU-SAR]
Благодарю за совет, уже запустил, о результатах расскажу.
Что-то не то этот скрипт считает. Получилось дерево длиной 13169 (вместо 5604 у меня), на котором субклады вполне выделяются, но дальше - например, внутри N1c - все люди уже оказываются братьями друг другу - никаких веток нет. Может, я зря отвечал "Yes" на все вопросы, которые этот скрипт спрашивал?

Оффлайн DimitriАвтор темы

  • Сообщений: 414
  • Страна: ru
  • Рейтинг +96/-0
  • Y-ДНК: N-Y9022>Y41021 [RU-KO] ЖМ: R1a-M458>FTB20451 [RU-BEL] МЖМ: C-M48>B80 [RU-ZAB]
  • мтДНК: HV9b1* [RU-SAR]
Вы неправильно поняли мою мысль. Речь шла не об определении корня NO, а о методе укоренения дерева.
Я вполне удовлетворился ручным укоренением. Понятно, что TNT построил дерево с корнем, близким к первому таксону (в моем случае это был гонконгский гаплотип O3). Я выделил мышкой этот корень в режиме Tree View, а затем правой кнопкой мышки нажал на корень N. После чего дерево укоренилось по-новому - где-то между N и O. Меня это вполне устроило. В чем тут некорректность?

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Благодарю за совет, уже запустил, о результатах расскажу.
Что-то не то этот скрипт считает. Получилось дерево длиной 13169 (вместо 5604 у меня), на котором субклады вполне выделяются, но дальше - например, внутри N1c - все люди уже оказываются братьями друг другу - никаких веток нет. Может, я зря отвечал "Yes" на все вопросы, которые этот скрипт спрашивал?

Вы, скорее всего получили консенсусное дерево. Надо было на вопрос "Желаете ли Вы вместо полного анализа определить консенсусное дерево?" отвечать нет.

Полный анализ на большем массиве данных (свыше 700 гаплотипов) у Вас должен был занять много времени, даже на двухядерном процессоре. Не менее 6-7 часов.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Я вполне удовлетворился ручным укоренением. Понятно, что TNT построил дерево с корнем, близким к первому таксону (в моем случае это был гонконгский гаплотип O3). Я выделил мышкой этот корень в режиме Tree View, а затем правой кнопкой мышки нажал на корень N. После чего дерево укоренилось по-новому - где-то между N и O. Меня это вполне устроило. В чем тут некорректность?

Я ничего не говорил о некорректности. Просто лично я сделал бы укорение на аутгрупп. Но если Ваш метод тоже дает реалистичное древо, то стало быть он также вполне корректен. :)

Оффлайн mouglley

  • Модератор
  • *****
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Для NO практически невозможно укоренение на сторонние гаплотипы без полного анализа всех гаплогрупп парагруппы NOP.
Это практически нереально из-за многократного перевеса в сторону R1b и перекоса R1a в сторону Европы.

Первоначально я укоренял на O и Q.
Теперь же полным анализом гаплотипов всех гаплогрупп парагруппы NOP занимается уважаемый Wertner, чьими предковыми гаплотипами мы и пользуемся.
У него прекрасные (мною освоенные) гаплотипы радоначальников всех гаплогрупп парагруппы NOP.

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Но Мурка (надеюсь, что только пока) не позволяет производит бутстрэп-анализы и анализ бремеровской поддержки ветви.


нет, бутстрапов не позволяет - иначе считать будет до второго пришествия :)

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
По большому секрету скажу что недокументированная подпрограмма Murka TP давно работает с missing states но она пашет только на очень маленьких выборках. Я использую это для восстановления амбигуити стейтс для мтднк. Идей как скрестить ужа и ежа (TP и MJ) у меня пока нет :) В смысле - скрестить в полной мере, с поддержкой всех фич традиционного поиска, включая амбигуити стейтс.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.