АвторТема: V1a1c и совпаденцы из Южной Финляндии  (Прочитано 1626 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: V1a1c и совпаденцы из Южной Финляндии
« Ответ #30 : 04 Февраль 2022, 19:09:10 »
он вроде как считался устаревшим из-за того, что игнорирует те самые возвратные мутации (может, и по другим причинам)

По другим. Возвратные и параллельные мутации он прекрасно учитывает, проблема в том что критерий стоимости дерева является метрическим, а не вероятностным. Например, используя парсимонный  бутстрэп, невозможно конвертировать его % в вероятность, а между тем именно это желанно. Но на практике недавние филогении восстанавливаются парсимонией идеально, более того, есть такие типы ML моделей, которые при стремлении числа сайтов к бесконечности дают ту же оптимальную топологию что парсимония. Практические расхождения парсимонии с правдоподобием для филогений человеческой глубины - маргинальные вещи. На практике правдоподобие нужно например для возрастов (берется парсимонная топология и запускается байес, использующий критерий правдоподобия), ну вот так чтобы на практике среди набора оптимальных или субоптимальных MP топологий не было оптимумов ML - почти казуистика. Всякие UPGMA и вообще дистантные методы такими свойствами как ML и MP просто не обладают, как конкуренция не рассматриваются. Если оставить вопросы математической красивости, а говорить о биологической практике, то на первом месте по значимости байес, далее ML (он всегда субоптимален, оптимум недостижим), затем парсимония (субоптимальная и в некоторый случаях доказательно-оптимальная). И лишь потом следуют все прочие методы, которые никогда не рассматриваются как универсальные.

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: V1a1c и совпаденцы из Южной Финляндии
« Ответ #31 : 04 Февраль 2022, 19:20:45 »
А байесовский подход предполагает, что мы перебираем все возможные топологии (которые априорно равны по вероятности) и считаем для каждого правдоподобие (то есть, насколько вероятно получить наблюдаемые данные при таком родстве между образцами, которое соответствует выбранной топологии). И дальше оптимальными считаются топологии с максимальным правдоподобием (или с наибольшей апостериорной вероятностью).

Нет, перебор "всего" заведомо невозможен, тк (2n-3)!! топологий придется еще помножить на число лейблингов (разметок внутренних узлов аллелями). Лишь в случае парсимонии бывает возможно при малом числе таксонов либо при низкой гомоплазии найти 1 оптимум и при еще более рестриктивных условиях - все оптимумы.

ML - всегда эвристика, хотя статус метода (принадлежность к классу NP) до сих пор не исследован, то есть там выражение "мы нашли оптимальную ML топологию" всегда значит "нам программа сказала это лучшее что она нашла".

Наконец в случае байеса работает mcmc, а она блуждает по определенному алгоритму который ни разу не перебор, то есть найти оптимум не может, более того, поскольку эта штука полиномиальна, сами понимаете, что истинные математические оптимумы она вряд ли не найдет (но может найти биологическую истину, да))

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: V1a1c и совпаденцы из Южной Финляндии
« Ответ #32 : 04 Февраль 2022, 19:24:16 »
То есть грубо говоря, из вами перечисленного к математическому перебору ближе всего точная (неэвристическая, оптимальная) парсимония, но она далеко не всегда "биологична", а вот ML и байес не точны, зато "биологичны" ))

Оффлайн GilgamewАвтор темы

  • GEDmatch_DY6750914 FTDNA_B671829 LivingDNA_LT0242379A YFull_YF97856
  • Сообщений: 29
  • Страна: ru
  • Рейтинг +13/-0
  • mtDNA-MF (бабушка по отцу) H14a
    • Мои статьи по истории Восточной Европы эпохи Золотой Орды
  • Y-ДНК: R1b>Z2103>PH1639 [predicted]
  • мтДНК: V1a1c (по mtFull совпадения в Южной Финляндии)
Re: V1a1c и совпаденцы из Южной Финляндии
« Ответ #33 : 04 Февраль 2022, 19:27:52 »
Нет, перебор "всего" заведомо невозможен, тк (2n-3)!! топологий придется еще помножить на число лейблингов (разметок внутренних узлов аллелями). Лишь в случае парсимонии бывает возможно при малом числе таксонов либо при низкой гомоплазии найти 1 оптимум и при еще более рестриктивных условиях - все оптимумы.

ML - всегда эвристика, хотя статус метода (принадлежность к классу NP) до сих пор не исследован, то есть там выражение "мы нашли оптимальную ML топологию" всегда значит "нам программа сказала это лучшее что она нашла".

Наконец в случае байеса работает mcmc, а она блуждает по определенному алгоритму который ни разу не перебор, то есть найти оптимум не может, более того, поскольку эта штука полиномиальна, сами понимаете, что истинные математические оптимумы она вряд ли не найдет (но может найти биологическую истину, да))

Ну да, я помню, что вместо полного перебора используют алгоритм, который, с одной стороны, "идёт в правильную сторону", с другой стороны, позволяет решить задачу за разумное время.

А оценка возраста кластеров в байесовском методе как возникает?

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: V1a1c и совпаденцы из Южной Финляндии
« Ответ #34 : 04 Февраль 2022, 19:34:08 »
З.Ы.: почитал вот тут https://forum.molgen.org/index.php?topic=8181.msg539361#msg539361 и понял, что не отличаю maximum likelihood и байесовский подход. То, что я выше описал - это, наверное, ML

Представьте что с помощью байеса ищете сумму углов треугольника, в зависимости от итераций определив что с такой-то достоверностью это 180 градусов )) Так же можно искать и парсимонный оптимум байесом. в филогенетике однако байесом ищут только ML оптимум. Но если бы этим дело ограничивалось, то тогда бы не говорили что это байес а просто считали одним из видов ML эвристики. На самом деле туда кроме ML оценки топологии (через общую с ML матрицу переходов аллелей) добавляют рождения и смерти (тип роста популяции), частоту мутаций и еще несколько видов априорных входных параметров. И как вознаграждение за труд получают выходные параметры возраста, скайлайн эффективной численности популяции и многое другое )) Тем байес и ценен: он моделирует реальную историю, а не только правдоподобную топологию как ML и тем более не метрические свойства топологии как MP.


Ещё момент - для оценки достоверности полученных топологий часто используют "бутстреп"-анализ.

бутстрэп особенно желанен для сомнительных топологий, когда в матрице данных есть заведомый шум

если метод построения топологии дает не 1 ответ а несколько, то анализом результатов обычно (но не всегда можно заменить бутстрэп

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: V1a1c и совпаденцы из Южной Финляндии
« Ответ #35 : 04 Февраль 2022, 19:40:06 »
А оценка возраста кластеров в байесовском методе как возникает?

даете ему на вход скажем норм распределение скорости мутаций вокруг некоего известного вам значения, либо калибровку (неск недавних клад скажем сопровождаете возрастом), на выходе он вам дает возраста всех клад, которые насчитал в зачотных деревьях.

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: V1a1c и совпаденцы из Южной Финляндии
« Ответ #36 : 04 Февраль 2022, 19:48:39 »
Ну да, я помню, что вместо полного перебора используют алгоритм, который, с одной стороны, "идёт в правильную сторону", с другой стороны, позволяет решить задачу за разумное время.

это везде так, только "правильная сторона" различна в парсимонии и байесе: в первом случае это чистый метод ветвей и границ (с опциональным добавлением общего Штейнера, релаксаций итп) а во втором это Метрополис (также с обилием вариаций, изобретенных в 90е, когда впервые в истории стали использовать вообще где либо реалистичный mcmc, а не тупейшие варианты какие были доступны во времена когда эту штуку изобрели для ядерщиков).

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: V1a1c и совпаденцы из Южной Финляндии
« Ответ #37 : 04 Февраль 2022, 20:22:46 »
только для байеса есть принципиальный момент, которого нет с парсимонией и ml: вы обязаны давать ему всю популяцию или нескольк популяций людей, а не только выборку какой-то гаплогруппы, этот метод не рассчитан на анализ конкретной ветви. потому что в том виде в каком идет о нем речь, как скажем в beast - это работа с популяциями, где рождаются и умирают организмы, где задается константа роста населения и модель роста итп характеристики, ненужные для анализа в стиле ml, которому нужна только матрица вероятности переходов или парсимонии которой хватит матрицы веса переходов.

Но это как бы естественная цена мощи метода, согласитесь. Есть виды байеса, где это не нужно, кажется в mrbayes есть варианты приемлемые для небиологических систем, типа лингвистики, там вроде норм просто набор родственных языков.
« Последнее редактирование: 04 Февраль 2022, 20:30:14 от Valery »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.