АвторТема: Калибровка скоростей мутаций для целей ДНК-генеалогии  (Прочитано 43057 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Agni

  • Сообщений: 699
  • Рейтинг +30/-56
Нет просто меня сама механика интересует зависимости скоростей от гаплогруппы, с биологической точки зрения непонятно. Этак можно постулировать что X1a2b3c4 имеет другие скjрости по сравнению с X1a2b3c5. С полиндромами и нулями я согласен, биологическая сторона понятна, но с другими маркерами я не понимаю биологической стороны вопроса, как SNP мутация может влиять на STR, хотя и не отрицаю этого.
Никакой биологии, одна гомоплазия.

То есть, два гаплотипа абсолоютно одинаковы по 67-ми маркерам.
Но один имеет снип1, случившийся две тысячи лет назад, а другой не имеет его.

Если использовать только STR, то все эти и близкие гаплотипы будут на одной ветви возрастом XXX лет.
Если мы добавим то, что кто-то из данной ветви имеет снип1, а остальные - нет, то возраст, благодаря дополнительному запутыванию/распутыванию данных для данных двух частей одной и той же ветви филогенетическими программами, заведомо, увеличится.

Ветв, просто, усложниться, и, соответственно, удревнится.
это то я понимаю. Но скорость мутаций STR то тут причем? Мы же их мерим/калибруем при уже известных родственниках. Непонятно, как наличие или отсутствие той или иной SNP мутации может влиять на скорость мутации какого-нибудь обычного STR локуса? То есть на вероятность мутации.

Оффлайн mouglley

  • ...
  • Сообщений: 7097
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Мы имеем гаплотипы Гедиминовичей и похожие гаплотипы, возраст которых XXX лет.
Мы имеем гаплотипы Гедиминовичей- L551 и те же похожие гаплотипы, возраст которых XXX+X00 лет.

Разница не ощущается?

Оффлайн NimissinАвтор темы

  • Сообщений: 2424
  • Рейтинг +768/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Хочу поделиться своими наивными расчетами в калькуляторе Семаргла.

По результатам обработки в калькуляторе Семаргла получены следующие результаты:
Цитировать
LINEAR ASD-METHOD
number of haplotypes: Nh = 22
number of markers: Nmrk = 66

number of mutations in all haplotype: ASDline = 1,79685716834
number of mutations in own marker: ASDlinemrk = 0,0272251086112

modal haplotype:
12,05 22,00 13,00 9,95 13,00 13,00 12,00 12,09 12,05 13,05 14,95 29,05 18,05 9,00 9,00 11,00 11,00 25,05 14,00 19,00 29,09 14,00 15,00 15,00 16,00 11,00 9,05 19,00 19,00 15,00 14,00 15,95 16,00 34,05 40,23 11,86 11,00 11,00 8,00 15,00 17,00 8,00 11,00 10,00 8,00 11,09 11,00 22,00 22,00 17,00 11,00 12,00 12,05 15,95 8,00 12,00 25,00 16,00 14,00 12,00 11,00 13,00 10,00 12,00 13,00 13,00

Уважаемый Шад, прошу пока не использовать этот калькулятор в части линейного метода. Он еще весьма сырой, не доведенный до рабочего состояния.
В линейном методе, как правило, не допускаются дробные значения базового гаплотипа. Расчет опирается на целочисленный аллель, который был принят за предковый.
В приведенном Вами модальном гаплотипе есть дробные значения. Семаргл обещал мне внести поправку.

Даже заголовок пока неправильный. Не может линейный метод быть ASD методом. Поскольку ASD - это Average Square Distance. То есть линейный метод не есть квадратичный метод.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
А то что маркеров 66, а не 67? Это должно быть учтено в формуле?
По идее - да. Но разница маловата, я бы не учитывал. Кроме того, если подвинуться на точности, нужно из средней частоты удалять mrate именно исключённых локусов.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
прошу пока не использовать этот калькулятор в части линейного метода. Он еще весьма сырой, не доведенный до рабочего состояния.
В линейном методе, как правило, не допускаются дробные значения базового гаплотипа. Расчет опирается на целочисленный аллель, который был принят за предковый. В приведенном Вами модальном гаплотипе есть дробные значения. Семаргл обещал мне внести поправку.
По оформлению калькулятора - да, замечания есть. Но чем больше испытателей примет участие в его тестировании и обсуждении, тем лучше он будет выглядеть в готовом виде. Мы пока не уверены, присутствуют ли эти дробные аллели в самом алгоритме. Возможно, что они просто автоматом перешли в результирующую картинку из ASD (обратите внимание - одинаковые)...
MSP и ASD я проверял ручным подсчётом - всё верно. Line, к сожалению поленился, нужно будет просчитать тест.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
В подобных случаях я поступаю следующим образом: беру нескосько семей со сколько-нибудь достоверной родословной (для N1 это - княжеские рода Рюриковичей, Гедиминовичей и Гетройцев)
Уважаемый mouglley.
К вопросу о калибровке. Wertner советовал проводить калибровку при наличии не менее 20 генеалогий  (где бы ещё столько накопать? :))). В вестнике №3, 2011 скорости калибровались по 10 генеалогиям (5 шт. R1a1+2 шт. N1c1+1шт. G2a3+1шт. J1c3d). По 3-м точкам - это, конечно, минимум, но можно. Среди N1c1 у них (в Вестнике) тоже фигурировали Рюриковичи и Гедиминовичи. Но в начале пути их было довольно мало (8 Рюриковичей L550 и 4 Гедиминовичей L551) - в статье не указано, сколько в итоге их вошло в калибровку. И не указано про 62 маркера (там речь шла о всех 67?)...
Поделитесь информацией - сколько у Вас гаплотипов по генеалогиям использовалось для калибровки. Насколько этого достаточно?
« Последнее редактирование: 06 Июнь 2012, 14:12:33 от Alexander »

Оффлайн Каржавин

  • ...
  • Сообщений: 1798
  • Рейтинг +144/-2
Хочу поделиться своими наивными расчетами в калькуляторе Семаргла.
Пока нет мэтров, дам своё видение.
Пока нет мэтров, тоже дам свое видение: полностью согласен с рассуждениями Александра.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6341
  • Страна: ru
  • Рейтинг +1341/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Простите... а кто же тогда мэтры?

Оффлайн mouglley

  • ...
  • Сообщений: 7097
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
К вопросу о калибровке. Wertner советовал проводить калибровку при наличии не менее 20 генеалогий  (где бы ещё столько накопать? :))). В вестнике №3, 2011 скорости калибровались по 10 генеалогиям (5 шт. R1a1+2 шт. N1c1+1шт. G2a3+1шт. J1c3d). По 3-м точкам - это, конечно, минимум, но можно. Среди N1c1 у них (в Вестнике) тоже фигурировали Рюриковичи и Гедиминовичи. Но в начале пути их было довольно мало (8 Рюриковичей L550 и 4 Гедиминовичей L551) - в статье не указано, сколько в итоге их вошло в калибровку. И не указано про 62 маркера (там речь шла о всех 67?)...
Поделитесь информацией - сколько у Вас гаплотипов по генеалогиям использовалось для калибровки. Насколько этого достаточно?
На данный момент имеется 12 Рюриковичей, 4 Гедиминовича и 6 Гедройцев.

Конечно же этого мало!

Но, с учётом того, что увеличение количества названных участников в двое, практически, не внесло каких-либо значительных изменений в скорости мутаций,  определяемым по их генеалогии за тот же период, думаю, какой-то статистический порог уже достигнут.

В планах подключить ещё пару семей N1c1 с неплохими родословными в калибровочную базу.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
На данный момент имеется 12 Рюриковичей, 4 Гедиминовича и 6 Гедройцев.
У меня есть почти те же (наверное), только 8 Рюриковичей и 4 Гедиминовича - из той самой статьи "Вестника" по калибровке.
Попробовал рассчитать их возраст МВП на калькуляторе Семаргла - могло бы помочь впоследствии откалибровать МВП по аналогии с линейным методом.
Для МВП нужно выявить узел, от которого расходится генеалогия (корень) и число ветвей от корня. Филогения на таких малых выборках, конечно наврёт, но МВП устойчив к ошибкам. И вот, что получилось:
Gediminas, ca. 1275 –  1341, 4 шт. гаплотипа, получено 1 деревце с 3-мя ветками, оценка МВП=0,060.
Rurik_N1c, d. 859, 8 шт. гаплотипов, получено 1 деревце с тоже 3-мя ветками, оценка МВП=0,09.

Использовал, правда, все 67 маркеров, которые были, ничего не исключал.

Если использовать Вашу mrate=0,00288 и, скажем, 25 лет, то получим TMRCA (Ged)=(0,06/0,00288)*25=525 лет
                                                                                                     и TMRCA (Rurik)=(0,09/0,00288)*25=775 лет.
То есть, до первопредков не дотягиваем - это узел промежуточных потомков.
А вот, если уменьшить частоту до Клёсовской (00179), возраст подтянется к отцам-основателям.

Уважаемый, mouglley, не смогли бы Вы помочь с определением местонахождения этих гаплотипов на ветвях реального дерева? И соответственно, тем же способом просчитать оценку МВП (в мутациях/маркер/поколение)? Предполагаю, что разница получится невелика - МВП должен проигнорировать моё неверное разделение.
На Вашем дереве, полагаю, возраст оценивается с помощью Ро-статистики, интересно было бы сравнить два этих метода расчёта.

« Последнее редактирование: 06 Июнь 2012, 20:49:37 от Alexander »

Оффлайн mouglley

  • ...
  • Сообщений: 7097
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
У меня есть почти те же (наверное), только 8 Рюриковичей и 4 Гедиминовича - из той самой статьи "Вестника" по калибровке.
Попробовал рассчитать их возраст МВП на калькуляторе Семаргла - могло бы помочь впоследствии откалибровать МВП по аналогии с линейным методом.
Для МВП нужно выявить узел, от которого расходится генеалогия (корень) и число ветвей от корня. Филогения на таких малых выборках, конечно наврёт, но МВП устойчив к ошибкам. И вот, что получилось:
Gediminas, ca. 1275 –  1341, 4 шт. гаплотипа, получено 1 деревце с 3-мя ветками, оценка МВП=0,060.
Rurik_N1c, d. 859, 8 шт. гаплотипов, получено 1 деревце с тоже 3-мя ветками, оценка МВП=0,09.

Использовал, правда, все 67 маркеров, которые были, ничего не исключал.

Если использовать Вашу mrate=0,00288 и, скажем, 25 лет, то получим TMRCA (Ged)=(0,06/0,00288)*25=525 лет
                                                                                                     и TMRCA (Rurik)=(0,09/0,00288)*25=775 лет.
То есть, до первопредков не дотягиваем - это узел промежуточных потомков.
А вот, если уменьшить частоту до Клёсовской (00179), возраст подтянется к отцам-основателям.

Уважаемый, mouglley, не смогли бы Вы помочь с определением местонахождения этих гаплотипов на ветвях реального дерева? И соответственно, тем же способом просчитать оценку МВП (в мутациях/маркер/поколение)? Предполагаю, что разница получится невелика - МВП должен проигнорировать моё неверное разделение.
На Вашем дереве, полагаю, возраст оценивается с помощью Ро-статистики, интересно было бы сравнить два этих метода расчёта.
Да, с помощью Ро-статистики.
Дерево всегда здесь:
http://forum.molgen.org/index.php/topic,248.0.html
Князья обозначены ромбами.

Все Рюриковичи - потомки Мономаха.
Точнее можно посмотреть на проекте уважаемого Andr.
http://freepages.genealogy.rootsweb.ancestry.com/%7Emozhayski/teksty/ydna.html

Гаплотипы на проектах http://www.familytreedna.com/public/rurikid/default.aspx и http://www.familytreedna.com/public/RussianNobilityDNA/default.aspx

Оффлайн Каржавин

  • ...
  • Сообщений: 1798
  • Рейтинг +144/-2
Если использовать Вашу mrate=0,00288 и, скажем, 25 лет, то получим TMRCA (Ged)=(0,06/0,00288)*25=525 лет
                                                                                                     и TMRCA (Rurik)=(0,09/0,00288)*25=775 лет.
То есть, до первопредков не дотягиваем - это узел промежуточных потомков.
К сожалению при таких малых количествах галпотипов и короткой временнОй дистанции разброс оценки ВБОП довольно значителен. Тем не менее, даже первые результаты интересны. С очень большой вероятностью такое малое количество гаплотипов сходится к промежуточному предку. Но в этих задачах надо смыкаться с генеалогами. Они могут помочь в определении истинной генеалогии хотя бы части использованных гаплотипов. Думается, через Российское Дворянское собрание это можно сделать.  У многих наших форумчан есть прекрасные контакты со специалистами в генеалогии.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Дерево всегда здесь: http://forum.molgen.org/index.php/topic,248.0.html Князья обозначены ромбами.
Спасибо.

Оффлайн mouglley

  • ...
  • Сообщений: 7097
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
То есть, до первопредков не дотягиваем - это узел промежуточных потомков.
А вот, если уменьшить частоту до Клёсовской (00179), возраст подтянется к отцам-основателям.
Да, спасибо.
На самом же деле, как Вы видите на последнем дереве N1 для реальных генеалогий пришлось не понизить, а ещё больше увеличить скорости - практически вдвое выше клёсовских.

Оффлайн Mukovnikov

  • Сообщений: 1469
  • Страна: ru
  • Рейтинг +237/-6
  • Y-ДНК: N-Y4339>Y5611>F1983>S10880; мжм: N
  • мтДНК: K1c1e; мж - V13; ммж - J1c4b; мммж - H
Все Рюриковичи - потомки Мономаха.
Кроме князя Волконского 167330, который Ольгович.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.