АвторТема: Почему древо мтДНК так плохо ветвится?  (Прочитано 1811 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн ДревАвтор темы

  • Сообщений: 894
  • Страна: ru
  • Рейтинг +244/-4
  • Y-ДНК: I-PH1410
  • мтДНК: H5a1a*
Пишу на примере своей родной H5a1a
На YFULL в ветке H5a1a* висит 41 человек. География от Испании и до Монголии.
На фтДНА у меня около 300 совпаденцев.
Почему при таком огромном количестве протестированных людей нельзя разветвить дерево дальше?
Если сравнить с древом по Y, то там под звёздочкой висит 1-3 образца, не больше.
В чём же проблема с мито?

Оффлайн NathanS

  • Сообщений: 1279
  • Страна: 00
  • Рейтинг +1211/-2
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #1 : 22 Июль 2023, 15:27:53 »
В чём же проблема с мито?

Основная причина - митоДНК существенно короче Y-ДНК. В Y-ДНК примерно 23,6 миллионов "полезных" оснований, там могут произойти интересные для исследования мутации. митоДНК - около 16,6 тысяч оснований. митоДНК получается почти в 1400 раз короче. Поэтому мутации там происходят значительно реже, чем в Y-ДНК - проходит много поколений пока появляется (стабильная) мутация.

Для выделения новой ветви в митодереве требуется много тестов неблизкородственных людей.

В mitomap пишут о примерно 61 тысяче полных митогеномов - они доступны для научных исследований.
Цитировать
2023 Update #2: On July 15, 2023 we added 1,779 new full-length (FL) and 1,410 new control region (CR) GenBank sequences to our database. This brings our total number of FL sequences to 61,168 ...

FTDNA пишет о 214 тыс полных митогеномов в их базе.
Цитировать
Discover the countries of origin for each branch of the mtDNA Haplotree using the world’s largest mtDNA database containing over 214,000 mtFull Sequences from over 180 different countries.

К сожалению пользователи FTDNA редко переносят свои митогеномы в Genbank и поэтому они остаются недоступными для научных исследований. FTNDA убрала со своей страницы анкеты для переноса данных в Genbank, а инструкции Айана Логана известны не всем. Получается, что FTDNA сидит на приличном количестве данных, которые эффективно закрыты для исследовний. Самостоятельно они пока ничего не выделили.

Есть проект Миллиона полных митогеномов в FTDNA, о котором пишет довольно известный блогер Роберта Эстес. Она описывает некоторые трудности в развитии митодерева - выявление мутаций, которые определяют митосубклады, нестабильные мутации, обратные мутации, гетеропалзмия, вставки и удаления баз.

Интерес ученых к митоДНК снизился. Последнее обновление митодерева - 17-я сборка - это 2015-2016 год, и какого-то серьезного пересмотра дерева пока не было, хотя конечно было несколько публикаций с обновлениями, уточнениями и попытками дальнейшего развития. Серьезного прегресса пока нет, что печально.

1. митоДНК короче и мутации реже,
2. не все мутации подходят для построения дерева, значимость многих мутация не ясна или сомнительна,
3. небольшая база доступных для исследований полных митогеномов,
4. угасший интерес к митоДНК у ученых.

С генеалогической точки зрения митоДНК (пока) так же менее интересно - выделяемые гаплогруппы слишком далеки от более современной генеалогии, даже полные совпаденцы по полному митогеному часто являются слишком удаленными, женские линии сложнее отследить, так как не было распространенных традиций использования матчества или передачи фамилии по прямой женской линии, тест не подходит для самостоятельного исследования и должен использоваться совместно с аутосомным или документальными данными. Учитывая такую низкую эффективность теста цена его слишком высока, чтобы быть привлекательной для генеалога. Да, он в принципе много дешевле BigY, но в сравнении с "выхлопом" не так интересно. Простые аутосомные тесты типа FamilyFinder также дешевле митотеста, а полезность результатов в целом несравнимо выше.

Делая полный геном мы получаем и полную митоДНК, как бы в довесок. Было бы хорошо, если бы эти данные отсылались в Genbank, но это требует дополнительных шагов, что существенно снижает количество пересылаемых и доступных данных данных.

YFull ведет свое экспериментальное дерево, что позволяет использовать данные из полногеномных тестов. Но и тут проблема с тем, что не все туда передают данные, а митоДНК с FTDNA тоже вероятно переносят не часто. Было бы хорошо, если бы YFull смогли в какой-то мере упростить передачу данных о митоДНК в Genbank - например, автоматизировать инструкции Айана Логана и предложить готовый к переносу в Genbank sqn-файл..
« Последнее редактирование: 22 Июль 2023, 15:44:14 от NathanS »

Оффлайн ДревАвтор темы

  • Сообщений: 894
  • Страна: ru
  • Рейтинг +244/-4
  • Y-ДНК: I-PH1410
  • мтДНК: H5a1a*
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #2 : 22 Июль 2023, 19:42:37 »
Для выделения новой ветви в митодереве требуется много тестов неблизкородственных людей.
Благодарю за развёрнутый ответ!
О каком, примерно, количестве образцов идёт речь?
Если 41 образец под * - это мало, то сколько ж их нужно?

Оффлайн Val_Metov

  • Сообщений: 1287
  • Страна: ru
  • Рейтинг +975/-2
  • Y-ДНК: J-Y94477
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #3 : 22 Июль 2023, 22:55:05 »
Уже не 23 а 60 млн в Y T2T

Оффлайн Srkz

  • Сообщений: 9186
  • Страна: ru
  • Рейтинг +5209/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #4 : 23 Июль 2023, 04:26:41 »
Благодарю за развёрнутый ответ!
О каком, примерно, количестве образцов идёт речь?
Если 41 образец под * - это мало, то сколько ж их нужно?
В смысле, "сколько"? Вы так пишете, как будто под уровнем H5a1a нет никаких ветвей. Можно прокрутить ниже и убедиться, что для формирования подветви достаточно двух образцов. Полагаю, если появится один новый образец с годной мутацией, и эта мутация совпадёт с кем-то из сорока одного "под звёздочкой", то они сформируют ещё одну подветвь. А остальные сорок образцов так и останутся в корне - у них либо нет мутаций вообще, либо есть, но ни с кем пока не совпавшие.

Оффлайн Lesla

  • Главный модератор
  • *****
  • Сообщений: 9741
  • Страна: ru
  • Рейтинг +3034/-10
  • FTDNA: 154400 (Big Y - 283049)
  • Y-ДНК: R1a-YP682 (VK06+)
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #5 : 23 Июль 2023, 18:47:56 »
1. митоДНК короче и мутации реже,
2. не все мутации подходят для построения дерева, значимость многих мутация не ясна или сомнительна,
3. небольшая база доступных для исследований полных митогеномов,
4. угасший интерес к митоДНК у ученых.
Я совсем согласен. И до недавнего времени был свято уверен, что невозможно по мито, даже при полном совпадении, что-то вразумительное сказать: 300 лет до общего предка или 3000.
Но тут меня носом ткнули в один из мито-субкладов - https://www.yfull.com/mtree/I1a1a/
где есть ветви и по 125 лет. Как вообще такое возможно? По мито и такая точность? Там же даже скорость мутаций другая, более медленная чем у Y и по любому должны быть большие цифры.

Оффлайн Tora_sama

  • Сообщений: 924
  • Страна: ru
  • Рейтинг +455/-0
  • Y-ДНК: E-FTB75628
  • мтДНК: H1b2g
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #6 : 23 Июль 2023, 19:20:46 »
1. митоДНК короче и мутации реже,
2. не все мутации подходят для построения дерева, значимость многих мутация не ясна или сомнительна,
3. небольшая база доступных для исследований полных митогеномов,
4. угасший интерес к митоДНК у ученых.
Я совсем согласен. И до недавнего времени был свято уверен, что невозможно по мито, даже при полном совпадении, что-то вразумительное сказать: 300 лет до общего предка или 3000.
Но тут меня носом ткнули в один из мито-субкладов - https://www.yfull.com/mtree/I1a1a/
где есть ветви и по 125 лет. Как вообще такое возможно? По мито и такая точность? Там же даже скорость мутаций другая, более медленная чем у Y и по любому должны быть большие цифры.
Вставлю свои 5 копеек
https://www.yfull.com/mtree/H1b2g/ Выглядит более менее, но тут ещё и везение нужно.
Жалко вы свою бабушку псковскую не загрузили на ифулл...
« Последнее редактирование: 23 Июль 2023, 19:41:28 от Tora_sama »

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1391/-7
  • Ultimate Matriarchy
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #7 : 23 Июль 2023, 23:18:46 »
Но тут меня носом ткнули в один из мито-субкладов - https://www.yfull.com/mtree/I1a1a/
где есть ветви и по 125 лет. Как вообще такое возможно? По мито и такая точность? Там же даже скорость мутаций другая, более медленная чем у Y и по любому должны быть большие цифры.

это артефакт системы, бага - потому что нельзя быть красивой такой такой молодой :P :P :P

возраст недавних митоклад определить очень трудно
особенно трудно на ранней стадии наполнения данными: если пофиксить алгоритм, заставив удревниться сабжевые клады, то вероятно, поедет что-то другое


Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1391/-7
  • Ultimate Matriarchy
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #8 : 24 Июль 2023, 01:25:02 »
Например, можно дополнить считалку возраста молодых ветвей некой эвристикой, которая увидев на ветке (см сабж) албанцев, венгров, русских, финнов и чехов, сразу смекнет, что клада не может происходить от дамы, жившей всего 500 лет назад. И допустим в этом случае она установит некое новое значение возраста, исходя из калибровки по радиусу разбегания. Но эта же эвристика выдаст лажу, найдя в некой кладе только финнов и соответственно сочтя их недавними родственниками (тогда как это могут оказаться финн с запада и потомок карельских эмигрантов - географически удаленные, и не происходящие от недавнего общего предка). Тем более метода налажает, или в лучшем случае не скажет ничего, увидев кладу россиян (откуда именно? Россия большая).

И все равно: если мы видим кладу без внутреннего привата, и в ней жители разных стран - то небиологические соображения расстояния дают больше информации, чем гистограмма TMRCA полного совпадения, которая считай ни о чем тут. То есть приходится действовать на глаз. Где-то начиная с N=8 для клад возрастом > 1000 лет вероятность не схватить ни одного привата становится очень малой, то есть там всегда что-то да выскочит, и это сделает подсчет возраста более надежным (ибо если не выскакивает, то мы имеем явный перебор близких родственников на дереве, и тогда возраст - гадание на кофейной гуще).

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1391/-7
  • Ultimate Matriarchy
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #9 : 24 Июль 2023, 01:36:41 »
В общедоступном интерфейсе дерева yFull увы нет инфы о количестве привата (я так понимаю, платным клиентам видно больше). Я обычно смотрю ветку, потом гружу из генбанка недостающие сиквенсы и смтрю у кого приват. Общую частоту раньше считал как N/40000, но теперь это уже 60000 вроде (неплохо бы YFull рапортовала сколько у них современных открытых сиквенсов и вообще сиквенсов разного типа, может они где-то это и пишут, но я не умею найти). Ессно что в выражении N/60000 N это число аксешнов, а не всех образцов, тк сколько там частных клиентов фиг знает, да и приват у них не проверишь.

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1391/-7
  • Ultimate Matriarchy
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #10 : 24 Июль 2023, 01:49:38 »
Что касается неучтенных YFull клад. Они довольно консервативны в дереве, я в среднем нахожу пропущенную ими кладу примерно 1 раз на 20 случаев поиска чего-то, в смысле каждые 20 раз, когда гружу сырые данные небольшой ветки и смотрю к кому ближе разбираемый мной сиквенс, то нахожу внутри сабжевой клады ветвь, пропущенную yFull и состоящую из по кр мере 2 образцов, записанных у них как базальные. Примерно в четверти случаев мой образец образует кладу с 1 из их базальных. В большинстве же случаев мой образец, будучи добавленным к их генбанковским, станет базальным (причем приват есть в большинстве случаев).

Насколько изменится описанная статистика, если бы всем были доступны их коммерческие образцы YF* - не знаю. Конечно, будет больше успешных поисков совпаденцев и больше новых клад, но от балды не сказать насколько.

Я уже 10 лет не делал экспериментов с кривой зависимости числа уникальных гаплотипов от N. Для полных сиквенсов наверное до плато еще далеко. А вот гаплотипы ГВС за эти 10 лет вполне могли бы начать выходить на плато.

Оффлайн ДревАвтор темы

  • Сообщений: 894
  • Страна: ru
  • Рейтинг +244/-4
  • Y-ДНК: I-PH1410
  • мтДНК: H5a1a*
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #11 : 24 Июль 2023, 09:29:14 »
В смысле, "сколько"? Вы так пишете, как будто под уровнем H5a1a нет никаких ветвей. Можно прокрутить ниже и убедиться, что для формирования подветви достаточно двух образцов. Полагаю, если появится один новый образец с годной мутацией, и эта мутация совпадёт с кем-то из сорока одного "под звёздочкой", то они сформируют ещё одну подветвь. А остальные сорок образцов так и останутся в корне - у них либо нет мутаций вообще, либо есть, но ни с кем пока не совпавшие.
Полагаете, кучу русских/поляков, испанцев и албанцев нельзя ни одной мутацией различить за последние 4200 лет?
Вот прям вообще ни одной?

Оффлайн ДревАвтор темы

  • Сообщений: 894
  • Страна: ru
  • Рейтинг +244/-4
  • Y-ДНК: I-PH1410
  • мтДНК: H5a1a*
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #12 : 24 Июль 2023, 09:36:14 »
Что касается неучтенных YFull клад. Они довольно консервативны в дереве, я в среднем нахожу пропущенную ими кладу примерно 1 раз на 20 случаев поиска чего-то, в смысле каждые 20 раз, когда гружу сырые данные небольшой ветки и смотрю к кому ближе разбираемый мной сиквенс, то нахожу внутри сабжевой клады ветвь, пропущенную yFull и состоящую из по кр мере 2 образцов, записанных у них как базальные. Примерно в четверти случаев мой образец образует кладу с 1 из их базальных. В большинстве же случаев мой образец, будучи добавленным к их генбанковским, станет базальным (причем приват есть в большинстве случаев).
Простой человек способен на это повлиять?
Например, как писал NathanS люди редко заливаются в генбанк... а может быть генбанк выделил бы новую ветвь и тогда её выделил бы и YFULL.

Оффлайн Asmat headhunter

  • Биохимическая субстанция
  • Сообщений: 15921
  • Страна: id
  • Рейтинг +1047/-36
  • И того казака те тунгусы пальмами тут искололи
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #13 : 24 Июль 2023, 10:08:45 »
Например, можно дополнить считалку возраста молодых ветвей некой эвристикой, которая увидев на ветке (см сабж) албанцев, венгров, русских, финнов и чехов, сразу смекнет, что клада не может происходить от дамы, жившей всего 500 лет назад.
А на деле может быть 5000 лет назад?)

Оффлайн Srkz

  • Сообщений: 9186
  • Страна: ru
  • Рейтинг +5209/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Re: Почему древо мтДНК так плохо ветвится?
« Ответ #14 : 24 Июль 2023, 10:12:03 »
Полагаете, кучу русских/поляков, испанцев и албанцев нельзя ни одной мутацией различить за последние 4200 лет?
Вот прям вообще ни одной?
Ну есть несколько "мусорных" в генеалогическом смысле участков мито, где мутации часто происходят туда-сюда, но для построения древа их не используют, поскольку появятся лже-схождения. А почему годных мутаций легко может не быть, вам уже писали:
В Y-ДНК примерно 23,6 миллионов "полезных" оснований, там могут произойти интересные для исследования мутации. митоДНК - около 16,6 тысяч оснований. митоДНК получается почти в 1400 раз короче. Поэтому мутации там происходят значительно реже, чем в Y-ДНК - проходит много поколений пока появляется (стабильная) мутация.

Или какая разница, 23 миллиона либо 16 тысяч, да? И то большое число, и это. Ну короче в 1400 раз, и что? Ну будут в 1400 раз реже мутации происходить, разве этого достаточно, чтобы у кого-то не произошло ни одной за тысячи лет? Да не, бред какой-то ;D (на самом деле, наверное, не именно в 1400 раз реже, и для правильной оценки надо учесть ряд других факторов, но ясно, что разница в скорости значительная).
Извиняюсь за некоторую раздражительность, но как-то грустно, что люди всё расписали, а их мысли прошли мимо.

Это раз. Два - как уже было написано, по приватным мутациям ветви не выделяют. Если она есть, но ни с кем не совпала, это тоже будет "под звёздочкой". И, как написал Валерий, на текущий момент это и есть наиболее частый вариант из всех:
Цитировать
В большинстве же случаев мой образец, будучи добавленным к их генбанковским, станет базальным (причем приват есть в большинстве случаев).
Вот вам и причина, почему накапливаются образцы в корне. Да, с ростом количества образцов будут продолжать выделяться новые ветви. Но ещё долгое время на каждую такую выделившуюся ветвь, с которой один образец "ушёл из базальников", будет успевать появиться несколько образцов, которые к базальникам прибавились, и их общая куча только вырастет. Плюс, часть из них окажется без приватных снипов, то есть не сформирует отдельную ветвь вообще никогда.
« Последнее редактирование: 24 Июль 2023, 10:31:03 от Srkz »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.