0 Пользователей и 1 Гость просматривают эту тему.
Подскажите скорость мутирования DYS635... (в привязке к чьей-нибудь системе)
Скорость близка к средней. Вот скорости мутаций по 78 маркерам: http://freepages.genealogy.rootsweb.ancestry.com/~geneticgenealogy/ratestuff.htm ... Судя по первой панели, это скорости Чандлера. Там же есть скорость 461-го
В приложении таблица S2 с данными о мутациях по 65 маркерам. По DYS635: 12 мутаций на 1920 мейозов, т.е. в среднем 0.00625 на маркер на поколение.
Вроде так (в порядке FTDNA)...........:
Цитата: wertner от 14 Ноябрь 2009, 15:57:51Вроде так (в порядке FTDNA)...........:Но эти веса сильно отличаются от весов, рекомендованных в статье В.М.Урасина в Вестнике ДНК, 2008, т.1, №2, стр.349. И главное, тем, что нет отличий в разы! У вас другая методика. Где почитать про Ваш способ расчёта?
Как помните, я в статье Вестника произвел расчет относительных скоростей мутаций 67 маркеров и на основе их сформировал веса для Network.Веса были сформированы как значения, обратно пропорциональные относительным скоростям мутаций. Но приведенный ниже пример показывает, что веса должны быть рассчитаны как пропорциональные минус логарифму абсолютной скорости мутации маркера.Причина в том, что при вычислении расстояний в Network веса мутаций складываются, хотя в тоже время вероятность мутаций нескольких маркеров равна произведению вероятностей мутаций отдельных маркеров. Чтобы произведение вероятностей корректно соотносилось с суммой весов и нужно использовать логарифм.Чтобы говорить конкретней, то если у маркера DYS 393 вероятность мутации принять за 0.00138 (за поколение), вероятность мутации маркера DYS 390 принять 0.00235, а вероятность мутации маркера DYS 426 принять за 0.00014 и взять предложенные мною в статье веса 10, 6, 99, соответственно, то вес двух единичных мутаций в маркерах DYS 393 и DYS 390 будет 10+6=16, меньше веса одной мутации в маркере DYS 426 (с весом 99). Но если вычислить вероятность двух единичных мутаций в маркерах DYS 393 и DYS 390, то получим 0.00138*0.00235=0,0000032, что менее вероятней, чем вероятность одной мутации в маркере DYS 426 (0.00014), а значит вес у этих двух единичных мутаций в маркерах DYS 393 и DYS 390 должен быть больше, чем вес одной мутации в маркере DYS 426.Вот иллюстрирующий пример.Возьмем такой искусственный .ych файл (гаплотипы придуманы на основе одного реального гаплотипа), в котором у первого гаплотипа мутации в маркерах DYS 393 и DYS 390, у второго гаплотипа мутация в маркере DYS 426, а у третьего гаплотипа такие же мутации (как у первого) в маркерах DYS 393 и DYS 390, такая же мутация (как у второго гаплотип) в маркере DYS 426 и кроме этого добавлена мутация в маркере DYS 394. Также в выборку добавлены гаплотипы с одной мутацией от модального в других маркерах.Если использовать старые веса, то файл .ych будет выглядеть так:D393,D390,D394,D391,D385a,D385b,D426,D388,D439,D389-1,D392,D389B,D458,D459a,D459b,D455,D454,D447,D437,D448,D449,D464a,D464b,D464c,D464d10,6,7,9,6,4,99,14,5,7,21,4,3,19,13,51,30,4,18,10,2,6,5,5,5112,18,14,10,13,13,12,12,13,14,13,16,18,9,9,11,11,23,15,19,33,12,15,15,161213,19,14,10,13,13,11,12,13,14,13,16,18,9,9,11,11,23,15,19,33,12,15,15,161312,18,13,10,13,13,11,12,13,14,13,16,18,9,9,11,11,23,15,19,33,12,15,15,161413,19,14,11,13,13,12,12,13,14,13,16,18,9,9,11,11,23,15,19,33,12,15,15,161513,19,14,10,12,13,12,12,13,14,13,16,18,9,9,11,11,23,15,19,33,12,15,15,161613,19,14,10,13,14,12,12,13,14,13,16,18,9,9,11,11,23,15,19,33,12,15,15,161713,19,14,10,13,13,12,13,13,14,13,16,18,9,9,11,11,23,15,19,33,12,15,15,16Тогда Network построит такую сеть:в которой третий гаплотип присоединен ко второму. Еще бы. 99 больше 16 (вес мутации в маркере DYS 426 больше веса мутаций в маркерах DYS 393 и DYS 390) и Network не хочет дублировать такую редкую мутацию, а дублирует две более частые мутации.Но если использовать веса, посчитанные на основе логарфма абсолютной скорости (54,50,51,53,49,46,73,56,48,51,60,45,44,59,56,67,63,47,58,53,41,50,48,48,48), то получится более верная сеть:в которой уже не дублируются две мутации (ведь общая вероятность того, что произошла мутация в этих маркерах равна 0,0000032 - очень редко), а дублируется одна мутация в маркере DYS 426 с вероятностью 0.00014.Теперь о том, как посчитаны новые веса. Для их расчета нужны абсолютные скорости маркеров. Я взял скорость мутации 67-маркерного гаплотипа, рассчитанную Анатолием Алексеевичем (aklyosov'ым), 0.145 за поколение (25 лет). Разделил ее пропорционально относительным скоростям маркеров, рассчитанных в моей статье. Получил абсолютные скорости маркеров, вот они: DYS 393 0,00138DYS 390 0,00235DYS 19/394 0,00209DYS 391 0,00164DYS 385a 0,00252DYS 385b 0,00372DYS 426 0,00014DYS 388 0,00103DYS 439 0,00285DYS 389-1 0,00194DYS 392 0,00071DYS 389-2 0,00397DYS 458 0,00464DYS 459a 0,00077DYS 459b 0,00108DYS 455 0,00028DYS 454 0,00048DYS 447 0,00345DYS 437 0,00081DYS 448 0,00150DYS 449 0,00660DYS 464a 0,00234DYS 464b 0,00293DYS 464c 0,00278DYS 464d 0,00281DYS 460 0,00251GATA H4 0,00210YCA IIa 0,00115YCA IIb 0,00155DYS 456 0,00376DYS 607 0,00249DYS 576 0,00593DYS 570 0,00610CDY a 0,00703CDY b 0,00843DYS 442 0,00299DYS 438 0,00077DYS 531 0,00063DYS 578 0,00025DYS 395S1a 0,00054DYS 395S1b 0,00076DYS 590 0,00017DYS 537 0,00146DYS 641 0,00051DYS 472 0,000006DYS 406S1 0,00198DYS 511 0,00156DYS 425 0,00132DYS 413a 0,00287DYS 413b 0,00244DYS 557 0,00361DYS 594 0,00067DYS 436 0,00020DYS 490 0,00032DYS 534 0,00520DYS 450 0,00029DYS 444 0,00324DYS 481 0,00478DYS 520 0,00241DYS 446 0,00361DYS 617 0,00112DYS 568 0,00087DYS 487 0,00141DYS 572 0,00132DYS 640 0,00048DYS 492 0,00052DYS 565 0,00081Затем вычислил натуральный логарифм каждой скорости и взял модуль полученных отрицательных значений. Умножил все полученные числа на константу так, чтобы наибольший вес был 99. Вот полученный ряд в стандартном порядке FTDNA:54,50,51,53,49,46,73,56,48,51,60,45,44,59,56,67,63,47,58,53,41,50,48,48,48,49,51,56,53,46,49,42,42,41,39,48,59,61,68,62,59,71,54,62,99,51,53,54,48,49,46,60,70,66,43,67,47,44,49,46,56,58,54,54,63,62,58
Метод все тот же, который был у меня в этой статье в Вестнике.
Вроде так (в порядке FTDNA):54,50,51,53,49,46,73,56,48,51,60,45,44,59,56,67,63,47,58,53,41,50,48,48,48,49,51,56,53,46,49,42,42,41,39,48,59,61,68,62,59,71,54,62,99,51,53,54,48,49,46,60,70,66,43,67,47,44,49,46,56,58,54,54,63,62,58
лишь для 17-маркерных построений, которые, как показано на форуме смысла не имеют. Есть всё же надежда, что 17-маркерное дерево сможет послужить просто иллюстрацией к комментарию для однофамильцев. без претензий, так сказать, на научность...
Цитата: wertner от 14 Ноябрь 2009, 15:57:51Вроде так (в порядке FTDNA):54,50,51,53,49,46,73,56,48,51,60,45,44,59,56,67,63,47,58,53,41,50,48,48,48,49,51,56,53,46,49,42,42,41,39,48,59,61,68,62,59,71,54,62,99,51,53,54,48,49,46,60,70,66,43,67,47,44,49,46,56,58,54,54,63,62,58Попробую и новые Ваши скорости, конечно.Но, думаю, структуры гаплогруппы N они не выявят.Первым делом, конечно, растяну их от 1 до 99.
А со статейными весами, всё-таки, результаты выдаёт.