АвторТема: YFULL.com - Интерпретация вашего полного сиквенса mtDNA  (Прочитано 49520 раз)

0 Пользователей и 2 Гостей просматривают эту тему.

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 5993
  • Страна: ru
  • Рейтинг +4191/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
В результате технической ошибки для некоторых пользователей были недоступны все страницы раздела mtDNA.
Сейчас проблема должна быть устранена.
Доступны отчеты по снипам, расшифровка возраста, матчи и прочие разделы.

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 5993
  • Страна: ru
  • Рейтинг +4191/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
и галочку не забудьте поставить

Да, без этой галочки никто не сможет вам написать личное сообщение.

Оффлайн ankr21

  • Сообщений: 2256
  • Страна: ru
  • Рейтинг +551/-0
  • Y-ДНК: I1-L1302
  • мтДНК: U3b1b
Здравствуйте. Есть уточнение по группе U3b1 https://www.yfull.com/mtree/U3b1/.
Во многих статьях уже упомянута группа U3b1c: https://www.ncbi.nlm.nih.gov/nuccore/?term=u3b1c
https://www.eupedia.com/europe/Haplogroup_U3_mtDNA.shtml
Эта группа маркируется мутациями 2833G, 8895C, 12738C. Туда можно отнести KJ856829.1, KF055871.1, KF055875.1, KF055879.1, KF055884.1, KF055889.1, KY411474.1, KY411475.1, KY411476.1, KY411477.1, JQ703911.1. Во избежании путаницы предлагаю ветку на MTree U3b1c (C712A * G6899A * A8742G) переименовать в U3b1e.



Оффлайн TK

  • Сообщений: 505
  • Страна: ru
  • Рейтинг +385/-0
Ещё замечание и пожелание.

Команда YFull известна хорошей математической подготовкой. Как раз для мтДНК тут непаханное поле. Точнее - я хочу затронуть тему TMRCA.

Несмотря на огромное количество работ, связанных с изучением скорости мутаций мтДНК, я до сих пор не встретил сводной работы, которая учитывала бы все возможные факторы. В основном, исследования проводятся методами изучения родословных и методами филогении. Однако, на мой взгляд, не принимается во внимание, например, численность населения и некоторые другие (на самом деле их сходу можно немало назвать) факторы.

В результате, формулы расчета времени TMRCA для мтДНК чаще всего являются упрощенными и приводят (на мой взгляд) к значениям, ставящим потребителей (да и исследователей, честно говоря) в тупик. Например, если посмотрим на распределение времен TMRCA для гаплогруппы U (согласно дереву YFull), то видим, например, явно выделенный пик для TMRCA = 1000 лет (среднее же значение показателя TMRCA для подгрупп данной гаплогруппы составило 7700):



Получается, что скоро многие начнут искать события примерно 1000-летней давности, которые могли привести к связи между их предками. :):)
Чтобы убрать пик TMRCA 1000 - надо учесть разные скорости мутаций соседних снипов (а у мтДНК они могут очень сильно отличаться - так, некоторые снипы могут вообще не мутировать, так как мутации в них просто приводят к нежизнеспособному потомству; другие же снипы могут мутировать вообще чуть ли не каждое поколение). Например, мутация A13434G является вполне себе пристойной (и даже встречается в разных гаплогруппах), а вот соседи T13433 и C13435 в мутациях вообще не были замечены!!!
А вот еще один рядом расположенный снип C13440T - встречается более чем в 10 раз реже, чем A13434G - следовательно, если для A13434G TMRCA будет 700 лет, то для C13440T - должно быт 7000 лет...

Теперь глянем, как может повлиять рост населения планеты (внимание - все значения приводятся лишь для примера).
Еще внимание - тут я немного путаю термины "скорость мутации" и "вероятность возникновения мутации" - но уж простите, просто немного лениво точно выражаться.
Предположим, что скорость мутации (для популяции в целом) зависит от количества населения:



Получаем довольно забавный результат, не правда ли?
Разумеется, результат совершенно неверный в общем случае (да и расчет производился для популяции планеты, а не рассматривался весь процесс наследования). Есть огромное количество иных факторов, которые влияют в разные стороны :)

Для примера были взяты "базовые" частоты мутаций HVR I и II из работы: Soares, Pedro et al. Correcting for Purifying Selection: An Improved Human Mitochondrial Molecular Clock // The American Journal of Human Genetics, Volume 84, Issue 6, - pp. 740-759.
Этим частотам волюнтаристски был ассоциирован год -5000 (5 тыс. до н.э.) - без особых оснований, просто это примерно -7700 лет, которые в среднем имеют субклады гаплогруппы U (при незаконченном еще расчете YFull).

Расчет населения планеты производился согласно: Капица С.П. Феноменологическая теория роста населения земли // Успехи физических наук, 1996, том 166, №1. - с. 67.

В плане заключения. Как мне кажется, можно вообще сделать "ход конём" и не думать о степени влиянии разных факторов и т.п., а просто привлечь "искусственный интеллект" (точнее, машинное обучение), тем более что сейчас есть возможность его использовать (как правило, в облачных сервисах, конечно). Для мтДНК, на мой взгляд (я пока лишь чуть-чуть поэкспериментировал с этим) это приводит к крайне интересным результатам и я полагаю, что картина TMRCA может кардинально измениться и проясниться.

Оффлайн Yaroslav

  • Сообщений: 18704
  • Страна: ru
  • Рейтинг +4679/-14
  • 76% East Europe + 17% Finland
  • Y-ДНК: J1a2b1a ZS3067, ЖМ: I2a1a2b1a1a1a1 FT37540, МЖМ: G2a2b1a1a1a2b2a FT159945
  • мтДНК: K1b1a1 T199C, МЖ: H13a1a1d
Огромнейшее спасибо YFull за новую услугу! Это значительный прогресс в понимании полученных результатов mtДНК. Вон, как оживился этот обычно вялотекущий раздел :)

Закинул рекламу стартового сообщения также в фб группы mt-гаплогрупп K и H, в которых принимаю участие.

Онлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Огромнейшее спасибо YFull за новую услугу! Это значительный прогресс в понимании полученных результатов mtДНК. Вон, как оживился этот обычно вялотекущий раздел :)

Закинул рекламу стартового сообщения также в фб группы mt-гаплогрупп K и H, в которых принимаю участие.

Я тоже с первого дня агитирую:)

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 5993
  • Страна: ru
  • Рейтинг +4191/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Во избежании путаницы предлагаю ветку на MTree U3b1c (C712A * G6899A * A8742G) переименовать в U3b1e.
Именование производится автоматически, но взяли на заметку. Постараемся переименовать в недалеком будущем.

Оффлайн grimsvotn

  • Some things in life are too complicated to explain in any language © Murakami
  • Сообщений: 6389
  • Страна: ru
  • Рейтинг +1771/-1
  • Потомок Морры
    • R-L1280 haplogroup project
  • Y-ДНК: R-Y220521 (RU-BY), Russian-Belorussian borderline cluster
  • мтДНК: T1a1y1 G4820A (RU-UA), Russian-Ukrainian lineage
Так же хочу выразить благодарность за новый интересный сервис))

Оффлайн TK

  • Сообщений: 505
  • Страна: ru
  • Рейтинг +385/-0
Во избежании путаницы предлагаю ветку на MTree U3b1c (C712A * G6899A * A8742G) переименовать в U3b1e.
Именование производится автоматически, но взяли на заметку. Постараемся переименовать в недалеком будущем.

А может и не переименовывать? История знает множество случаев несовпадения в разных источниках.
Так, для Y-ДНК сходу можно привести пример с гаплогруппой высокого уровня N1a1 (нынешнее имя согласно ISOGG), определяемой снипом M46/Page70/Tat.
А уж эта гаплогруппа упоминается просто в огромном количестве публикаций :)

ПериодНаименование
до 2008N3
до 2017N1с1
сейчасN1a1
(при этом, для неё в публикациях также встречается ещё и имя N1c)

К тому же, чаще всего любой нормальный исследователь в своих работах обычно упоминает, какой источник он имеет в виду при именовании гаплогрупп.

Оффлайн TK

  • Сообщений: 505
  • Страна: ru
  • Рейтинг +385/-0
Как расшифровать обозначения:  id:FJ****** , id:KX*****, id:KU*****? Данные, видимо, из научных публикаций, хотелось бы больше информации: какие публикации, где собран генетический материал и все такое.
Эти номера образцов, занесенных в Genbank:
https://www.ncbi.nlm.nih.gov/genbank/
Вводите идентификатор в строку поиска вверху.

Оффлайн penzel

  • Сообщений: 136
  • Страна: by
  • Рейтинг +84/-8
  • Y-ДНК: R-YP951
  • мтДНК: N1a3
подскажите, из какой работы этой образец ?  id:<X2VCLN>

Оффлайн Виталий77

  • Однодворец ищущий свои корни
  • Сообщений: 1544
  • Страна: ru
  • Рейтинг +491/-0
  • FTDNA: 297613
  • Y-ДНК: R1a-A7015
  • мтДНК: H13a1a1c
подскажите, из какой работы этой образец ?  id:<X2VCLN>
это YFullовские результаты интерпретации Big Y. Просто нужно, что бы пользователь зашёл в свой аккаунт и изменил настройки приватности и тогда будет виден id.

Оффлайн TK

  • Сообщений: 505
  • Страна: ru
  • Рейтинг +385/-0
... я хочу затронуть тему TMRCA.
Немного "в продолжение банкета".
Провел маленькое свежее моделирование в Excel, выполнив его с огромным количеством приближений и допущений.
Тем не менее, посмотрим результат.

В данном случае влияющим фактором берём только рост населения планеты. Идея была такая.
Смотрим на суммарное население планеты, которое когда-либо обитало на планете (т.е. включая умерших!) на каждый конкретный момент времени (у меня были чуть другие цифры, но ученые оценивают это в диапазоне 80-110 млрд. к настоящему времени).
Я брал период с 14 тыс. лет до н.э. и по настоящее время с интервалом 100 лет (просто лень было интегрировать и пр. и я несколько упростил свои расчёты).
Для этого населения мы можем в каждый момент оценить возможное количество мутаций с момента mt "Eve" (я брал по RSRS).
Коэффициенты скорости мутации считались независимыми от снипа и просто подбирались для того, чтобы количество мутаций распределилось совпало с общим ожидаемым количеством на настоящий момент.
Далее смотрим, в какой момент могло накопиться требуемое количество мутаций, чтобы образовать нужный субклад.

Для пробы я взял развитие субкладов с R2 по R2b2 (без особых на то оснований, разумеется): https://yfull.com/mtree/R2/
В качестве отправной точки для субклада R2 - взял значение 13719 ypb согласно Behar, D.M., van Oven, M., Rosset, S., Metspalu, M., Loogväli, E.L., Silva, N.M., Kivisild, T., Torroni, A. and Villems, R. (2012). A “Copernican” reassessment of the human mitochondrial DNA tree from its root. American journal of human genetics, 90(4), 675-684.

Получившееся занёс в табличку (показатели везде - в годах до настоящего времени (ybp)):
Субклад| Новых мутаций| YFull Mtree formed| YFull Mtree TMRCA| Behar et al., 2012b| Тестовый расчет
R2| -| 45000| 26000| 13719| 13700
R2-a| 1| 26000| 23000| -| 9100 - 4100
R2b| 4| 23000| 14400| -| 1700 - 500
R2b2| 5| 14400| 2900| -| 200 - 100

Мы видим, что значения особенно меняются для "молодых" субкладов. Это кажется разумным, поскольку рост количества населения приводит к большему общему количеству возникающих мутаций. Однако, непосредственно к данному расчету есть огромное количество претензий. Самая непонятная - зачем я считал "включая умерших", ведь у них мутаций уже не может возникнуть? - Да просто сильно упрощал расчёт вместо учета степенных показателей.

Результат данного расчета, конечно, отличается в цифрах от моих прошлогодних экспериментов с "машинным обучением" - там идея была в моделировании мутаций популяции, но кончилось тем, что я загубил модель. Однако, результат того моделирования также приводил к тому, что молодые субклады имели кардинально меньшее время возникновения, чем можно было предположить исходя из встречаемого кое-где показателя 550 лет до общего предка при полном совпадении мтДНК. Тогда я тоже получил результат, что даже 2-3 отличия полного мито могут означать чуть ли не всего лишь 200 лет. Вот такие вот пироги.

Разумеется, надо всё это обдумать (и, может, оформить в виде статьи, если будет время). Да и литературу почитать сперва снова - может, уже за нас всё сделали и опубликовали?
Но главный вывод - для молодых субкладов общих предков можно искать не в глубине тысячелетий, а во вполне обозримом прошлом.

Оффлайн Srkz

  • Сообщений: 8462
  • Страна: ru
  • Рейтинг +4812/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Ок, частота возникновения новых субкладов увеличивается по мере роста популяции, это логично. Почему из этого следует, что TMRCA каждого отдельно взятого субклада должны радикально падать? Мутации чаще, но и субкладов больше, количество возникающих дополнительных мутаций в пересчёте на один уже имеющийся субклад нижнего уровня должно сохраняться?

Попробую показать на гипотетическом примере. Допустим, есть древняя митогруппа "X". Постепенно от неё отщеплялись группы X1, X2, X3 (пускай нумерация строго отображает порядок возникновения) и т.д. При росте населения среди этих групп действительно будет больше отщепившихся ближе к нашему времени, чем древних. Но ведь благодаря этому же эффекту ближе к нашему времени появятся и группы наподобие X1a, X1b, X2a, X1a1 и так далее, которые тоже будут участвовать в расчёте TMRCA группы X.

Навскидку кажется, что искажение TMRCA должно давать не количество населения, а скорость его роста, причём локальная скорость. Причём примерно-средние значения этого искажения уже входят в калиброваные скорости и таким образом учтены. Но может, интуиция подводит и я где-то путаюсь, тем более, у нас уже ночь ;D
« Последнее редактирование: 22 Март 2019, 19:50:42 от Srkz »

Оффлайн TK

  • Сообщений: 505
  • Страна: ru
  • Рейтинг +385/-0
Точно! Рост количества субкладов надо учесть. Но кроме этого, надо ещё учесть их насыщенность представителями (людьми). И, в принципе, даже понятно, как всё это сделать!
Однако, это точно вылезает за рамки 2-х часового моделирования :)
Но тема-то интересная?!

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.