АвторТема: Выборки гаплотипов - теория и практика  (Прочитано 30634 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #15 : 12 Сентябрь 2009, 20:53:56 »
Ув. Михаил,

А сколько вариантов деревьев в каждом файле для Меги? Один?
Вы не могли бы прислать эти выборки на мейл, я немного поколдую над ними в Mr.Bayes?
Файлы приложены к предыдущему посту.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #16 : 12 Сентябрь 2009, 20:54:50 »
Весёлые картинки:

Оффлайн Grigoriev

  • Администратор
  • *****
  • Сообщений: 3098
  • Страна: ru
  • Рейтинг +187/-3
    • Молекулярная генеалогия
  • Y-ДНК: O3a3c
  • мтДНК: J1c
Re: Выборки гаплотипов - теория и практика
« Ответ #17 : 12 Сентябрь 2009, 20:58:55 »
А будут ли пояснения/комментарии к "веселым картинкам"?

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #18 : 12 Сентябрь 2009, 21:02:22 »
Соображения?
Навскидку: очень хорошо разбежались 185 и 220.
Сейчас просчитаю времена.
Буду считать не по ветвям. А именно по всей выборке чохом.
По счастью, используемый мною метод совершенно не подвязан на топологию.

Поэтому для сопоставления получаемых результатов, хотелось бы получить времена именно по каждой выборке. А не по скачущим ветвям.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #19 : 12 Сентябрь 2009, 21:08:23 »
А будут ли пояснения/комментарии к "веселым картинкам"?
Да, пожалуйста.
 :)
Допустим, по первому построению 185 и 220 у нас висят на одной ветви. А дальше они себе бегут в разные стороны по мере увеличения количества рассматриваемых сэмплов.

Начальная группа у нас 10 гаплотипов. Но схожий процесс полагаю действует и по выборке в 300 образцов.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #20 : 12 Сентябрь 2009, 21:43:23 »
Итак первая кучка.
Имеем медианную генетическую дистанция (модель бесконечных аллелей): 7.
Проверяем перекос. Средняя медианная генетическая дистанция: 6.89. Неплохо.
Имеем 25 маркеров и 18 матчей.
Скорость 0.0021 поколение / (маркер * мутация).
Поколенный интервал 30 год / поколение. (Подсчет идёт именно в годах. В отличии от поколений, они не предполагают двойственности толкований.)
Доверительный интервал 50%. (Исходим из того, что речь будет вестись о больших глубинах, так как генетическая дистанция составляет 28 процентов от длины гаплотипа.)

Полученный результат: 2360-2580 лет до общего предка первой десятигаплогруппной выборки.
« Последнее редактирование: 12 Сентябрь 2009, 23:23:53 от Mich Glitch »

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: Выборки гаплотипов - теория и практика
« Ответ #21 : 12 Сентябрь 2009, 22:48:58 »
Михаил, я сделал вариант N=50 и получил 115 субоптимальных деревьев. У них дикое расстояние между собой:

Pairwise RF tree distance, avg.   0.6532
Pairwise RF tree distance, stdev.   0.2345

Ветви будут плясать не подеццки. Я бы сказал видно что руками сделано :) Природа таки любит порядок :)

Это обнадеживает :)

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #22 : 12 Сентябрь 2009, 23:00:19 »
Попробую сделать прикидку по таблице Адамова-Клесова.
В ней используются одношаговые мутации (см. приложенную таблицу).
Итак имеем для 10 гаплотипов 376 одношаговых мутации.
Делим сию цифирь на 25 (количество маркеров) а затем на 10 (размер выборки), получаем 1.504.
Правильно?
Ага, похоже расчет TMRCA ведётся как у всех по модели бесконечных аллелей, а не по одношаговым мутациям. (Если что, поправьте. Выполняю подсчет по аналогии. Поэтому не вдаваясь в вопрос "почему", просто объясните "как".)
Смотрим вторую табличку (модель бесконечных аллелей).
Имеем 310 мутаций. Делим на 25 и на 10, получаем 1.24.

Что так, что эдак, получается у меня полная ерунда.

Знатоки использования таблицы, просветите!  ???

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #23 : 12 Сентябрь 2009, 23:03:13 »
Михаил, я сделал вариант N=50 и получил 115 субоптимальных деревьев. У них дикое расстояние между собой:

Pairwise RF tree distance, avg.   0.6532
Pairwise RF tree distance, stdev.   0.2345

Ветви будут плясать не подеццки. Я бы сказал видно что руками сделано :) Природа таки любит порядок :)

Это обнадеживает :)
Т.е., используя способ линейной экстраполяции, полагаем, что беря выборку в 100 гаплотипов, а потом увеличивая её на 50 односубкладных гаплотипов мы получаем недеццкие пляски ветвей. Так?  ::)

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: Выборки гаплотипов - теория и практика
« Ответ #24 : 12 Сентябрь 2009, 23:20:00 »
Михаил, я сделал вариант N=50 и получил 115 субоптимальных деревьев. У них дикое расстояние между собой:

Pairwise RF tree distance, avg.   0.6532
Pairwise RF tree distance, stdev.   0.2345

Ветви будут плясать не подеццки. Я бы сказал видно что руками сделано :) Природа таки любит порядок :)

Это обнадеживает :)
Т.е., используя способ линейной экстраполяции, полагаем, что беря выборку в 100 гаплотипов, а потом увеличивая её на 50 односубкладных гаплотипов мы получаем недеццкие пляски ветвей. Так?  ::)


Не думаю. Гомоплазия уже на имеющихся 100 будет такая какая есть и не намного увеличится со следующими 10. Пока не пойму почему так получилось, честно. Я на 25 локусах обычно встречал более стабильную картину.

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: Выборки гаплотипов - теория и практика
« Ответ #25 : 12 Сентябрь 2009, 23:25:13 »
Вот пожалуй неплохая иллюстрация почему надо быть крайне осторожным с Ро-статистикой на микросателлитах. В то же время иные методы (те что используете Вы или АК) здесь определенно рулят. Притом что филогении как таковой не выявляется. Сигнала нет, один шум.

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: Выборки гаплотипов - теория и практика
« Ответ #26 : 13 Сентябрь 2009, 00:08:55 »
При N=20 увы ситуация не лучше, стало быть мое предположение об искусственности выборки наверняка ложное.

В то же время, Ро гуляет по деревьям N=20 в пределах 7.3+-0.3. Два объяснения:

1) Нуль-гипотеза. В Мурке мидпойнт - это точка минимизирующая дисперсию расстояния до всех засвидетельствованных гаплотипов. Находится чаще всего вблизи модала. Поэтому даже если топология - лажа, "возраст" может оказаться стабильным, и более того, во всех случаях, кроме самых патологических, так и будет.

2) В этом что-то есть :) Типа того, что "тики" 25 локусов слышны, даже если топология - лажа. Это можно формализовать, доказав, что Ро-статистика примененная к оптимальным деревьям отражает истинную картину даже тогда когда гомоплазия зашкаливает настолько что филогенетические методы бессильны.

У меня подозрение что истина (увы) в п 1). Я бы хотел здесь услышать мнение ув. Каржавина.
« Последнее редактирование: 13 Сентябрь 2009, 00:15:57 от Valery »

Оффлайн aklyosov

  • Сообщений: 117
  • Рейтинг +11/-8
Re: Выборки гаплотипов - теория и практика
« Ответ #27 : 13 Сентябрь 2009, 02:39:46 »
С комментариями картина. увы, печальна. Отражает то, что авторы комментариев не понимают сути.

А суть в том, что здесь ветвей как таковых нет. Это не ветви, а просто временные образования, не отражающие сути выборки. Это как бросать монету, и каждый раз строить "ветви" выпаданий, и ломать над ними голову, причитая, что это все не имеет смысла.  А оно и в самом деле не имеет.

Есть один параметр - среднее число мутаций на маркер (или на гаплотип). И нечего выдумывать какие-то мурки-жмурки.

Короче, вот результат. На 10 гаплотипах получается среднее число мутаций на маркер 0.264+/-0.032. Это дает время до общего предка 4200+/-670 лет.

На 20 гаплотипах имеем среднее число мутаций на маркер 0.284+/-0.084. Это дает время до общего предка 4575+/-600 лет. То же самое число в пределах погрешности вычислений.

На 50 гаплотипах имеем среднее число мутаций на маркер 0.274+/-0.054. Это дает время до общего предка 4400+/-500 лет. То же самое число в пределах погрешности вычислений.

Это все рассчитано с совершенно обоснованной и калиброванной скоростью мутации 0.00183 на маркер на поколение в 25 лет для 25-маркерных гаплотипов. Откуда эти 0.0021?? Откуда 30 лет?? Какие к этому основания??

Все давно уже разработано и проверено сотни раз. Зачем изобретать велосипед? 

Как я и говорил, даже 10 гаплотипов дают нормальное время для общего предка в пределах погрешности. Гаплотипы - штука упрямая. 

P.S. Выбросьте свою мурку. Не теряйте лицо.

Оффлайн aklyosov

  • Сообщений: 117
  • Рейтинг +11/-8
Re: Выборки гаплотипов - теория и практика
« Ответ #28 : 13 Сентябрь 2009, 02:45:00 »
При N=20 увы ситуация не лучше, стало быть мое предположение об искусственности выборки наверняка ложное.

В то же время, Ро гуляет по деревьям N=20 в пределах 7.3+-0.3. Два объяснения:

1) Нуль-гипотеза. В Мурке мидпойнт - это точка минимизирующая дисперсию расстояния до всех засвидетельствованных гаплотипов. Находится чаще всего вблизи модала. Поэтому даже если топология - лажа, "возраст" может оказаться стабильным, и более того, во всех случаях, кроме самых патологических, так и будет.

2) В этом что-то есть :) Типа того, что "тики" 25 локусов слышны, даже если топология - лажа. Это можно формализовать, доказав, что Ро-статистика примененная к оптимальным деревьям отражает истинную картину даже тогда когда гомоплазия зашкаливает настолько что филогенетические методы бессильны.

У меня подозрение что истина (увы) в п 1). Я бы хотел здесь услышать мнение ув. Каржавина.

Дорогой Valery,

Вы хоть понимаете, что все это чудовищно?  Это настолько диффузно и размазано, что оторопь берет. Ну нельзя же так.

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: Выборки гаплотипов - теория и практика
« Ответ #29 : 13 Сентябрь 2009, 02:57:25 »
Цитировать
А суть в том, что здесь ветвей как таковых нет. Это не ветви, а просто временные образования, не отражающие сути выборки. Это как бросать монету, и каждый раз строить "ветви" выпаданий, и ломать над ними голову, причитая, что это все не имеет смысла.  А оно и в самом деле не имеет.


Так в том и дело: на микросателлитах филогении нет. Я неоднократно пытался Вам это доказать. Теперь похоже Вы это понимаете. Но помимо микросателлит есть огромная масса вещей где есть куда больший порядок чем

Цитировать
Есть один параметр - среднее число мутаций на маркер (или на гаплотип).

И вот там всякие мурки-жмурки рулят. Исторически так сложилось, что эволюцию изучали именно на таких примерах. Микросателлиты - можно сказать последний писк моды еще очень неясного свойства. Сейчас еще ничего не понятно: может со временем как-то ситуация определится и кто-нибудь найдет как с ними управляться. А может быть, наоборот, их будут использовать только по одному поводу - потому что они неплохо тикают.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.