АвторТема: Вопрос по тесту митохондриальной ДНК (просветите новичка)  (Прочитано 4591 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Valery

  • Сообщений: 7636
  • Страна: 00
  • Рейтинг +934/-6
  • Ultimate Matriarchy
этой таблице годочков уже 9 будет, и то она сделана не по всем на тот момент данным. Я занимался мт с начала 00х по 2013.

Оффлайн Навля

  • R1a-Y2902
  • Сообщений: 529
  • Страна: cs
  • Рейтинг +190/-1
  • Y-ДНК: R1a-Z645-Z280-Y2902-Y35272
  • мтДНК: HV4a1-a*
Доброго дня!
Правильно ли понимаю, что два (+ископаемый) образца живут в настоящее время с мутацией которая образовалась 8700 лет назад ?
Спасибо!



Ещё один образец добавил


Оффлайн Gilgamew

  • GEDmatch_DY6750914 FTDNA_B671829 LivingDNA_LT0242379A YFull_YF97856
  • Сообщений: 29
  • Страна: ru
  • Рейтинг +13/-0
  • mtDNA-MF (бабушка по отцу) H14a
    • Мои статьи по истории Восточной Европы эпохи Золотой Орды
  • Y-ДНК: R1b>Z2103>PH1639 [predicted]
  • мтДНК: V1a1c (по mtFull совпадения в Южной Финляндии)
Реконструкция деревьев без мутаций (такие ветви в традиционной филогенетике сжимаются, collapsed) - несколько иной предмет, чем реконструкция по мутациям. Парсимония и праводоподобие не работают с отсутствием мутаций. С точки зрения этих подходов линки без мутаций имеют фиксированную нулевую стоимость и тривиальное правдоподобие. Но Байес может с этим работать, тк он моделирует рождения и смерти безотносительно наличия мутаций.

Однако его работа здесь специфична. Более всего на результат влияет выбор relaxed clock vs strict clock - как скорррелированы мутационные длины ветвей в разных частях дерева. При выборе первой установки допускается довольно долгая жизнь без мутаций, соответственно лезет большое число линий, восходящий к общему предку без единой мутации. Вторая установка наоборот в своей крайности поместит все идентичные сиквенсы HG* под одного недавнего предка. То есть различия тут в общей длине времени, которое не возникает мутаций: таковое допускается либо большим, либо меньшим, программа оценивает правдоподобие по этой установке. Стандартная же функция ML работает только с матрицей замен, не умея оценивать правдоподобие "жизни без мутаций", тк чистый ML не знает времени, как и парсимония (MP).

Поскольку выбор клока strict vs relaxed зависит от воли исследователя, то вывод: как захочу, так и будет  ;D

А есть всё-таки какие-то критерии выбора strict vs relaxed? И второй момент - насколько осмысленно, скажем, для одной и той же выборки данных строить оба варианта, сравнивать результат и если различия не превышают какой-то критический уровень (то есть, выбор клока не влияет критически на топологию) - считать дерево (или часть дерева) достоверным

Оффлайн Gilgamew

  • GEDmatch_DY6750914 FTDNA_B671829 LivingDNA_LT0242379A YFull_YF97856
  • Сообщений: 29
  • Страна: ru
  • Рейтинг +13/-0
  • mtDNA-MF (бабушка по отцу) H14a
    • Мои статьи по истории Восточной Европы эпохи Золотой Орды
  • Y-ДНК: R1b>Z2103>PH1639 [predicted]
  • мтДНК: V1a1c (по mtFull совпадения в Южной Финляндии)

Мое старое дерево

Разве что последний столбец вот этой таблицы может представлять интерес с т.зр. определения веса мутаций: величина, обратная нормированному на медиану значению, коррелирует с "тяжестью" мутационного перехода.

Можно ли чуть подробнее про три последних столбца:
Frequency in the database - это, видимо, встречаемость мутации в выборке?
Frequency after applying phylogenetically-motivated corrections - а это что за коррекция?
Number of related changes on the Tree - а это встречаемость мутации в узлах дерева? И если поделить каждое значение на медиану по всем мутациям, то мы получим оценку филогенетической значимости мутации? Может быть, имеет смысл делить на максимальное значение, чтобы оценка была от 0 до 1?

Оффлайн Valery

  • Сообщений: 7636
  • Страна: 00
  • Рейтинг +934/-6
  • Ultimate Matriarchy
Можно ли чуть подробнее про три последних столбца:
Frequency in the database - это, видимо, встречаемость мутации в выборке?
Frequency after applying phylogenetically-motivated corrections - а это что за коррекция?
Number of related changes on the Tree - а это встречаемость мутации в узлах дерева? И если поделить каждое значение на медиану по всем мутациям, то мы получим оценку филогенетической значимости мутации? Может быть, имеет смысл делить на максимальное значение, чтобы оценка была от 0 до 1?

Frequency in the database - да, встречаемость, но в сырых данных

Frequency after applying phylogenetically-motivated corrections - лучше брать эту, тк это результат правки, устранения фантомов и поиска пропущенного авторами

Number of related changes on the Tree - число переходов с этой мутацией, узлов будет больше, тк мутация будет сидеть у всех потомков если только у кого не обратится вспять

Вопрос как нормировать последнюю колонку - сейчас посмотрел, что когда я писал тот камент, то забыл какое там значение. Коли там не частота в базе, а число переходов - да, на максимум, конечно, спс за поправку))

Оффлайн Valery

  • Сообщений: 7636
  • Страна: 00
  • Рейтинг +934/-6
  • Ultimate Matriarchy
А есть всё-таки какие-то критерии выбора strict vs relaxed? И второй момент - насколько осмысленно, скажем, для одной и той же выборки данных строить оба варианта, сравнивать результат и если различия не превышают какой-то критический уровень (то есть, выбор клока не влияет критически на топологию) - считать дерево (или часть дерева) достоверным

советую иметь в виду удобную вам топологию и смотреть при каком параметре она получается
тк идти как казалось бы по-науке, от принципа к результату - увы тут нужен точный расчет что этот принцип работает, иначе рискованно

вообще при наличии достаточного чиисла мутаций не будет разницы в топологии, только в возрасте, топологическая разница будет чаще там где есть мультифуркации, которые программа оформит как бифуркации, причем нередко одинаковые решения она примет в большинстве деревьев на основе внутреннего применения клока. Короче, пробуйте оба типа клока.

Оффлайн Valery

  • Сообщений: 7636
  • Страна: 00
  • Рейтинг +934/-6
  • Ultimate Matriarchy
Коли там не частота в базе, а число переходов - да, на максимум, конечно, спс за поправку))

на среднее нужно нормировать колонку частоты аллеля, чтобы равно зачесть крайние случаи ранней мутации, которая есть почти у всех людей либо почти ни у кого нет, тк оба типа могут иметь одинаково высокую надежность. но когда есть число переходов то надобность в частоте отпадает

Оффлайн Навля

  • R1a-Y2902
  • Сообщений: 529
  • Страна: cs
  • Рейтинг +190/-1
  • Y-ДНК: R1a-Z645-Z280-Y2902-Y35272
  • мтДНК: HV4a1-a*
У племянника и дядьки в ФТДНА показывает генетическую дистанцию 1.
Получается что у матери племянника (тоесть сестра дядьки) произошла мутация в мтДНК?


Оффлайн grimsvotn

  • МЖМ Y-DNA: I1-L1248 > Y20842 > I-Y21569 Scandinavia > Germanic tribes > BY86574 Late Scandinavian migrants? Russia-Sweden-Finland
  • Сообщений: 5935
  • Страна: ru
  • Рейтинг +1569/-1
  • W.Slavic 49%, Magyar 18%, E.Slavic 12%, Baltic 21%
    • I1-L1248 haplogroup project
  • Y-ДНК: R-FGC11627 Zarubintsy culture > Y220521 - (Principality of Smolensk?) RU-BY borderline cluster
  • мтДНК: T1a1 RU-UA-IRL- T9899C - Bronze Age tribes > (Yamna steppe pastoralists / Pontic-Caspian steppe?) G4596A - Kievan Rus' era migrations(?)
Скорее всего какие-то филогенетически не важные мутации в HVR2, которые могут отличаться даже у ближайших родственников:
https://forum.molgen.org/index.php/topic,7095.0.html

Оффлайн Навля

  • R1a-Y2902
  • Сообщений: 529
  • Страна: cs
  • Рейтинг +190/-1
  • Y-ДНК: R1a-Z645-Z280-Y2902-Y35272
  • мтДНК: HV4a1-a*
Скорее всего какие-то филогенетически не важные мутации в HVR2, которые могут отличаться даже у ближайших родственников:
https://forum.molgen.org/index.php/topic,7095.0.html
Спасибо. Почитаю.
Но у дядьки и третьего человека дистанция 0.
У племянника и третьего человека (+дядька) дистанция 1.

Родство с третьим человеком документально не установлено.
Ютфул всех разместил в одну ячейку.

Оффлайн grimsvotn

  • МЖМ Y-DNA: I1-L1248 > Y20842 > I-Y21569 Scandinavia > Germanic tribes > BY86574 Late Scandinavian migrants? Russia-Sweden-Finland
  • Сообщений: 5935
  • Страна: ru
  • Рейтинг +1569/-1
  • W.Slavic 49%, Magyar 18%, E.Slavic 12%, Baltic 21%
    • I1-L1248 haplogroup project
  • Y-ДНК: R-FGC11627 Zarubintsy culture > Y220521 - (Principality of Smolensk?) RU-BY borderline cluster
  • мтДНК: T1a1 RU-UA-IRL- T9899C - Bronze Age tribes > (Yamna steppe pastoralists / Pontic-Caspian steppe?) G4596A - Kievan Rus' era migrations(?)
А Вы посмотрите: какие именно мутации отличаются. Выложите тут, глянем :)

Оффлайн Навля

  • R1a-Y2902
  • Сообщений: 529
  • Страна: cs
  • Рейтинг +190/-1
  • Y-ДНК: R1a-Z645-Z280-Y2902-Y35272
  • мтДНК: HV4a1-a*
А Вы посмотрите: какие именно мутации отличаются. Выложите тут, глянем :)
Вот


Оффлайн grimsvotn

  • МЖМ Y-DNA: I1-L1248 > Y20842 > I-Y21569 Scandinavia > Germanic tribes > BY86574 Late Scandinavian migrants? Russia-Sweden-Finland
  • Сообщений: 5935
  • Страна: ru
  • Рейтинг +1569/-1
  • W.Slavic 49%, Magyar 18%, E.Slavic 12%, Baltic 21%
    • I1-L1248 haplogroup project
  • Y-ДНК: R-FGC11627 Zarubintsy culture > Y220521 - (Principality of Smolensk?) RU-BY borderline cluster
  • мтДНК: T1a1 RU-UA-IRL- T9899C - Bronze Age tribes > (Yamna steppe pastoralists / Pontic-Caspian steppe?) G4596A - Kievan Rus' era migrations(?)
Здесь обсуждался похожий случай со вставкой Y: https://forum.molgen.org/index.php/topic,12641.0.html

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.