АвторТема: Калибровка скоростей мутаций для целей ДНК-генеалогии  (Прочитано 38405 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн NimissinАвтор темы

  • Сообщений: 2402
  • Рейтинг +759/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Позвольте вернуться к своему вопросу, так как ясности пока нет. Какая разница вообще, по какому методу считать возраст, если любой метод можно откалибровать, взяв соответствующую частоту мутаций? Ведь по линейному методу Клёсов получает результат тот же, какой можно получить по квадратичному методу, немного увеличив частоту. Пользователю всё равно ведь, какой фотоаппарат пользовать, было бы фото удачное и качественное.
Хорошее замечание. Я об этом тоже говорил Сергею.

Каждый метод должен иметь свои частоты мутаций. Но важно, чтобы откалиброванные скорости мутаций были применимы для широкого интервала возрастов MRCA. Тут не все так просто. В этом смысле наиболее стабильные - генеалогические скорости, определенные по парам "отец-сын".

Оффлайн Каржавин

  • ...
  • Сообщений: 1798
  • Рейтинг +144/-2
Позвольте вернуться к своему вопросу, так как ясности пока нет. Какая разница вообще, по какому методу считать возраст, если любой метод можно откалибровать, взяв соответствующую частоту мутаций? Ведь по линейному методу Клёсов получает результат тот же, какой можно получить по квадратичному методу, немного увеличив частоту. Пользователю всё равно ведь, какой фотоаппарат пользовать, было бы фото удачное и качественное.
Хорошее замечание. Я об этом тоже говорил Сергею.

Каждый метод должен иметь свои частоты мутаций. Но важно, чтобы откалиброванные скорости мутаций были применимы для широкого интервала возрастов MRCA. Тут не все так просто. В этом смысле наиболее стабильные - генеалогические скорости, определенные по парам "отец-сын".
Да они не просто наиболее стабильные, а единственно наиболее точно вычисляемые.
Что может быть точнее непосредственного помаркерного сравнения отцовского и сыновьего галпотипов?  ;D

А вот методика Рожанского-Клесова по сравнению с опорой на пары "отец-сын" обладает множеством неопределенностей:
1. Возможная неточность времени жизни начального предка исследуемой исторической генеалогии.
2. Для ряда генеалогий исследуемая совокупность гаплотипов может не иметь даже пары гаплотипов, общим предком которых является истинный начальный предок. Увеличение количества гаплотипов исследуемой генеалогии не решает эту проблему полностью. Следует также учесть, что количество потомков ограничено, да и то, что вероятность того, что у родоначальника обязательно было не менее двух сыновей, чьи потомки дожили до наших дней, весьма мала. Для "коротких" генеалогий даже несколько начальных поколений от начального предка, веточки от которых не дожили до наших дней, могут на десятки процентов омолодить истинного начального предка исследуемой совокупности гаплотипов. Если же привлекаются очень древние генеалогии, то начальный их этап становится весьма легендарным и недостоверным (и это - проблема).
3. Часть гаплотипов может принадлежать другой генеалогической ветви, скажем, довольно близкой по родству к исследуемой, и никакими методами типа коэффициентов сходимости и прочего этого не выявить. Наличие, скажем, Рюриковичей принадлежащих далеким друг от друга гаплогруппам - серьезное предупреждение.
4. Невозможно вычислить неравновесность вероятностей делеции и инсерции, которая влияет на оценку TMRCA.
5. Невозможность вычисления частот многошаговых мутаций, которая также влияет на оценку TMRCA.
Попутно замечу, что у нас, поклонников пар "отец-сын", уже есть аналитически полученные расчетные формулы, которые позволяют учесть и неравновесность вероятностей делеции и инсерции, и многошаговые мутации, так что здесь проблем нет.

Единственным аргументом, который использовал Клесов в критике метода оценки частот мутаций по парам "отец-сын" была, якобы, малая статистика по мейозам. На самом деле уже к середине 2011 года статистики стало намного больше, чем по гаплотипам исторических генеалогий, которые использовали Клесов-Рожанский в своих калибровках. Поскольку статистика по парам "отец-сын" непрерывно накапливается, то альтернативы им в задаче калибровки частот мутаций просто нет.
Я провел корректный расчет разброса (среднеквадратичного отклонения) оценки TMRCA только за счет неточного знания истинных частот мутаций в маркерах для объема статистики по маркерам в парах "отец-сын", которая имеется в настоящее время. Так вот, среднеквадратичное отклонение получилось равным всего 11%. Очевидно, что такой точности оценивания частоты мутаций (с учетом вышеперечисленных проблем) получить по историческим генеалогиям невозможно.

Кроме вышеуказанных проблем метода Клесова-Рожанского у этих авторов есть и еще одна важная методологическая проблема: использование для оценки накопленного количества мутаций ASD-метода и линейного метода, которые имеют систематическую погрешность оценки (ASD метод имеет большую, а линейный метод - значительно меньшую, но, тем не менее имеет). По крайней мере, эту систематическую ошибку, занижающую оценку TMRCA, можно было бы не вносить, используя метод выборочных пар, который мы коллективом участников Молгена практически довели до ума.
Сама по себе идея Рожанского на опору реальных генеалогий хорошая, но она запоздала, как минимум, на пару лет. В настоящее время альтернативы парам гаплотипов "отец-сын" просто не существует.

Теперь хотелось бы возразить на следующее высказанное ранее утверждение: по линейному методу Клёсов получает результат тот же, какой можно получить по квадратичному методу, немного увеличив частоту. Пользователю всё равно ведь, какой фотоаппарат пользовать, было бы фото удачное и качественное.
Каждый раз для каждой конкретной совокупности гаплотипов приходится вводить собственную поправку, и неизвестно откуда их брать. В свое время мы с Д.Адамовым такие поправки рассчитали (все опубликовано), но они требуют знания (хотя бы приблизительного) общего количества выживших членов данной генеалогии. И поправка небольшая будет только для количества членов более миллиона. А у того же Сомерледа сколько выживших потомков? Миллион или несколько тысяч? А это очень существенно!! Для такого объема генеалогий все становится весьма неопределенно, поэтому ввести какие-то поправки "на всю оставшуюся жизнь" не получится, увы!

Тем не менее, весьма интересно провести исследование реальных генеалогий, которые использовал Рожанский в своих калибровках, на предмет их достоверности и поиска времени реальных предков исследуемых гаплотипов. А для этого следует использовать калибровочные частоты по парам "отец-сын". Уже сейчас видно, что некоторые совокупности галпотипов действительно "вырастают" из документально зафиксированного начального предка, а некоторые несколько моложе, и здесь одно из двух: или предок явно легендарный, или от начального предка нет доживших до нас веточек, а все нынешние потомки произошли от его более позднего потомка, и это может иметь интерес для уточнения генеалогии.
« Последнее редактирование: 30 Март 2012, 19:11:30 от Каржавин »

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
А вот методика Рожанского-Клесова по сравнению с опорой на пары "отец-сын" обладает множеством неопределенностей:
Зато эта методика неплоха тем, что не обращает внимания на всё множество неопределённостей. Она опирается исключительно на калибровку, которая раз за разом подтверждает среднюю скорость мутаций для метода или уточняется (как это видно по первому-второму постам темы).
Поправки для конкретных выборок? Насколько они велики? Укладываются в пределы погрешности калибровки?
Да, может быть минус в неверных калибровочных генеалогиях с заниженными возрастами - поработать над увеличением статистики по выборкам.
С другой стороны медод выборочных пар хорош тем, что если он опирается на частоты f-s, то калибровки не требует. А построив график по документированным генеалогиям, мы сможем оценить, омоложены они или нет и на сколько (по отклонению аппроксимирующей прямой от прямой известной средней частоты f-s)..
Вообще, сравнить два метода можно только одним способом - взять эталонную выборку и подсчитать её возраст двумя способами. Если же документированно её возраст неизвестен (глубина велика), то как можно провести арбитраж?

Оффлайн Каржавин

  • ...
  • Сообщений: 1798
  • Рейтинг +144/-2
А вот методика Рожанского-Клесова по сравнению с опорой на пары "отец-сын" обладает множеством неопределенностей:
Зато эта методика неплоха тем, что не обращает внимания на всё множество неопределённостей. Она опирается исключительно на калибровку, которая раз за разом подтверждает среднюю скорость мутаций для метода или уточняется (как это видно по первому-второму постам темы).
Все дело в том, что такое уточнение никоим образом не может уменьшить систематического смещения. Вот он и подтверждает раз за разом свою смещенную оценку TMRCA. Это смещение объективно присутствует. Изнутри методики Рожанского-Клесова измерить это смещение принципиально невозможно. Я же об это чуть выше уже писал.
Поправки для конкретных выборок? Насколько они велики? Укладываются в пределы погрешности калибровки?
Систематическая "увеличивающая" поправка для 67-ми маркерных гаплотипов к калибровочным значениям частоты мутаций [мутаций/(гаплотип*год)], которые вычислены по методу Рожанского-Клесова, более 30%. Более точно можно будет сказать после обработки обновленных наборов гаплотипов известных исторических персонажей.
Да, может быть минус в неверных калибровочных генеалогиях с заниженными возрастами - поработать над увеличением статистики по выборкам.
С другой стороны медод выборочных пар хорош тем, что если он опирается на частоты f-s, то калибровки не требует. А построив график по документированным генеалогиям, мы сможем оценить, омоложены они или нет и на сколько (по отклонению аппроксимирующей прямой от прямой известной средней частоты f-s)..
Вот этим конечно же нужно будет заняться. Но сначала надо закончить дело по калибровке частот мутаций по парам "отец-сын". Пока у нас имеются незакрытые разногласия. Своего окончательного слова не сказали Nimissin и VVR.
Вообще, сравнить два метода можно только одним способом - взять эталонную выборку и подсчитать её возраст двумя способами. Если же документированно её возраст неизвестен (глубина велика), то как можно провести арбитраж?
А не надо никакого арбитража  ;D
Во-первых, частоты мутаций по парам "отец-сын" сами по себе весьма объективны и свободны от массы проблем косвенных методик их вычисления, к коим я отношу метод Рожанского-Клесова.
Во-вторых, чисто аналитически все проблемы метода Клесова-Рожанского видны, и здесь никакой арбитраж не нужен.

А вообще самое прикольное то, что метод Рожанского-Клесова ошибается дважды, но в разные стороны. В результате иногда он будет давать и верное решение. Дело в том, что при вычислении TMRCA на заниженные калибровочные частоты мутаций делится количество мутаций, которое подсчитывается, скажем, линейным или другим методом. Но это количество мутаций занижено относительно истинного (это доказано). Поэтому деление заниженного кол-ва мутаций на заниженную частоту мутаций может дать результат близкий к истинному, но может дать и весьма далекий (деление - противная операция в этом отношении).
Но для большого количества гаплотипов линейный метод может давать количество мутаций весьма близкое к истинному. И в этом случае деление на заниженную частоту мутаций может дать сильно завышенный результат в TMRCA.

Оффлайн Agni

  • Сообщений: 699
  • Рейтинг +30/-56
Было бы здорово разрешить эти все споры строго научным методом. И такой есть, Это проверить все это на "мышах" в лабораторных условиях. Тот метод который даст точный результат, тот и есть правильный, А потом уже его перенести на людей. Это самый правильный путь, но наверное самый дорогой.

Оффлайн Каржавин

  • ...
  • Сообщений: 1798
  • Рейтинг +144/-2
Было бы здорово разрешить эти все споры строго научным методом. И такой есть, Это проверить все это на "мышах" в лабораторных условиях. Тот метод который даст точный результат, тот и есть правильный, А потом уже его перенести на людей. Это самый правильный путь, но наверное самый дорогой.
Ну зачем? Уже по людям довольно много информации. И она непрерывно накапливается, поскольку тесты на отцовство делаются по всему миру постоянно.

Оффлайн Agni

  • Сообщений: 699
  • Рейтинг +30/-56
Было бы здорово разрешить эти все споры строго научным методом. И такой есть, Это проверить все это на "мышах" в лабораторных условиях. Тот метод который даст точный результат, тот и есть правильный, А потом уже его перенести на людей. Это самый правильный путь, но наверное самый дорогой.
Ну зачем? Уже по людям довольно много информации. И она непрерывно накапливается, поскольку тесты на отцовство делаются по всему миру постоянно.
Затем, что люди это некая случайная, и достаточно лживая выборка. Несколько поколений, это уже большая случайность, и малая научность. А мыши это чистый рафинированный строгий процесс. За несколько лет можно получить с десяток поколений, на которых проследить все мутации, их законы вероятностей, скорости и тд. Если на них получишь результат, то он будет неопровержим и контролируем. А пока все это на людях - всегда будет можно предаться к методике.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Но это количество мутаций занижено относительно истинного (это доказано).
На самом деле в абсолютных величинах оно завышено. Если там в подсчёте участвуют все пары, а в МВП только "выборочные", то от всех пар набежит и больше мутаций. Но при делении на большое число пар частота оказывается занижена.
В МВП число пар (знаменатель) меньше, следовательно и частное от деления выше.
Получается, что в линейном методе имеется некая избыточная информация, занижающая частоту. Если её как-то полезно использовать, то это могло бы быть плюсом метода.

Оффлайн Каржавин

  • ...
  • Сообщений: 1798
  • Рейтинг +144/-2
... люди это некая случайная, и достаточно лживая выборка. Несколько поколений, это уже большая случайность, и малая научность. А мыши это чистый рафинированный строгий процесс. За несколько лет можно получить с десяток поколений, на которых проследить все мутации, их законы вероятностей, скорости и тд. Если на них получишь результат, то он будет неопровержим и контролируем. А пока все это на людях - всегда будет можно предаться к методике.
Ну не все так печально. На самом деле случайность - это очень даже неплохо! Например, разработаны специальные методики строгого соблюдения случайности в различного рода опросах. Фактически, мы также имеем дело с опросами, но несколько специфическими. Конечно, просмотреть поведение мутаций на множестве поколений было бы интересно, но я лично не знаю, как можно будет перенести результаты оценки частот мутаций с мышей на людей. Этот вопрос не ко мне, а, скажем, к Центуриону. Мое дело вместе с товарищами соорудить корректную математическую методу расчетов.
По крайней мере, забугорные генетики в своих публикациях в настоящее время ратуют за использование частот, полученных по парам "отец-сын", считая, что полученные результаты вполне допустимо применять на временнОм интервале по крайней мере в исторический период.

Оффлайн Каржавин

  • ...
  • Сообщений: 1798
  • Рейтинг +144/-2
Но это количество мутаций занижено относительно истинного (это доказано).
На самом деле в абсолютных величинах оно завышено. Если там в подсчёте участвуют все пары, а в МВП только "выборочные", то от всех пар набежит и больше мутаций. Но при делении на большое число пар частота оказывается занижена.
В МВП число пар (знаменатель) меньше, следовательно и частное от деления выше.
Не совсем так. Я тоже иногда путаюсь. Действительно, когда мы используем ASD, мы суммируем набег мутаций по всем возможным парам галпотипов, то есть это количество пар равно N*(N-1), где N - количество гаплотипов. Но потом просуммированный результат делим на общее количество пар, то есть, на число N*(N-1). Таким образом, получаем количество мутаций, которое имело место на некоем СРЕДНЕМ по длине (по времени) генеалогическом пути, соединяющем два гаплотипа через их ближайшего общего предка (не общего начального предка, а именно ближайшего для конкретной пары гаплотипов).
Следует подчеркнуть важный момент: для любой пары гаплотипов количество мутаций, вычисленное по ASD, не требует никаких возвратных мутаций, НО! Это количество мутаций соответствует не генеалогическому расстоянию от данного гаплотипа до общего начального предка всей совокупности гаплотипов, а расстоянию до разветвления к другому гаплотипу этой пары (это может быть любой "промежуточный" предок, и даже отец, если проверяются галпотипы двух родных братьев).
Следовательно, усредняя в ASD-методе количество мутаций, полученных по всем возможным парам гаплотипов, мы вычисляем количество мутаций для среднего по длине генеалогического пути между парой гаплотипов, а не для максимального генеалогического пути, который соответствует паре гаплотипов, у которых ближайшим общим предком является истинный начальный предок. То есть, вычисленное количество мутаций соответствует не истинному генеалогическому расстоянию от нас до начального предка, а короче во времени.
В методе выборочных пар находятся с помощью филогении только такие пары гаплотипов, у которых общий ближайший предок - истинный начальный предок. То есть эти пары гаплотипов связывают одинаковые и максимально возможные генеалогические пути. Таких пар может быть много, а может быть вообще одна. Все зависит от структуры конкретного филогенетического древа. Пусть таких пар было найдено M штук. По каждой паре мы ASD методом вычислим количество мутаций, просуммируем по всем этим М парам и разделим на это самое число M. Очевидно, что мы получили количество мутаций для некоего среднего генеалогического пути. Но теперь то длина среднего генеалогического пути - это максимальная длина!
Вот почему, несмотря на то, что количество пар гаплотипов в методе выборочных пар меньше, чем для ASD метода, результат (среднее количество мутаций на одну пару гаплотипов) будет всегда больше. И этот результат соответствует истинному генеалогическому расстоянию от общего начального предка до наших современников (финальных потомков).
Резюмируя, ASD метод вычисляет количество мутаций для некоего среднего генеалогического пути, соединяющего пару гаплотипов через их ближайшего общего предка. Метод выборочных пар вычисляет количество мутаций для генеалогического пути, соединяющего пару гаплотипов, ближайшим общим предком которых является истинный начальный предок. Чтобы результат по ASD приблизить к истинному количеству мутаций, которое "натикало" от начального предка, приходится вводить так называемые "обратные" мутации, которые "удлиняют" среднее генеалогическое расстояние до максимального. Конечно, эта поправка не точная, ведет себя довольно "хитро", но она позволяет не используя филогении дать лучшее приближение к истинному значению, чем классический ASD метод.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
... в конце 2010 года Клесов и Рожанский пересмотрели скорость для 67-маркерных гаплотипов.
По ряду причин, которые будут рассмотрены при дальнейшем обсуждении, полученные калибровки применимы только для линейного метода. Эти скорости не могут быть применены для метода ASD (в разных вариантах), МВП, МВПР.
Цитата: Nimissin
Зависимость TMRCA, рассчитанной методом ASD, от оценки TMRCA, полученной линейным методом, на реальных выборках была построена Игорем Рожанским T(ASD) ~ 1.13 T(lin).
Тут имеет место заминка. Подсчёт в мутациях, хоть и абсолютен, но всё равно хочется в годах.
Нужного для МВП перехода к поколениям-годам для 37-67 маркеров пока нет (нет частот f-s для некоторых локусов). /Хотя для 43 Соренсона - можно/.
Следовательно, единственным вариантом для страждущих остаются ASD и линейный методы. Для линейного есть все частоты, а для ASD - коэффициент перехода 1,13.
Однако и тут есть неувязка. Всё это - в среднем. Например, в калькуляторе Семаргла, если посмотреть по тесту-образцу (12 маркеров), то оценка ASD=0,175, а линейная оценка=0,1333. Итого соотношение =1,31. А в других случаях - много меньше, чем 1,13 (например на 67-маркерной выборке =1,03). То есть, для конкретного примера ASD и lin дают разные возрасты - даже здесь нет согласия.
« Последнее редактирование: 24 Май 2012, 22:31:41 от Alexander »

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6335
  • Страна: ru
  • Рейтинг +1333/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Хочу поделиться своими наивными расчетами в калькуляторе Семаргла.

Я уже писал про семью Hough/Huff/HoffHaugh/, имеющую достаточно представительный семейный проект на FTDNA.
Цитировать
However, nost of them are thought to be descendants of  Derrick Pauluszen Hoff(1649-1730), who came to New Amsterdam before 1660.  When the British purchased New Amsterdam, they required
all Dutch persons in New Amsterdam to take up surnames. For an unknown reason, Derrick chose "Hoff".  He had many sons and began a dynasty of Hoffs,
most of whom changed their names to "Huff" within the next 2 generations.
Для обработки были выбраны 67-маркерные гаплотипы в количестве 22.
Цитировать
191247;Huff;;12;22;13;10;13;13;12;12;12;13;14;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;40;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
81111;Huff;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;10;19;19;15;14;16;16;34;40;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
212769;Huff;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;15;16;34;39;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
153520;Riley;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;38;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
N16165;Huff;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;40;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
165151;Huff;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;40;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
127754;Huff;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;40;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
133381;Huff;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;40;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
172691;Marlow;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;41;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
213826;Huff;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;41;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
169897;Huff;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;41;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
189374;Hoff;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;41;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;13;16;8;12;25;16;14;12;11;13;10;12;13;13
156072;Huff;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;35;41;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
166843;Huff;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;30;14;15;15;16;11;9;19;19;15;14;16;16;34;40;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
149506;Marlow;;12;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;26;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;33;41;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
165855;Huff;;12;22;13;10;13;13;12;12;12;13;15;29;19;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;38;9;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
31434;Hoff;;12;22;13;10;13;13;12;12;12;14;15;30;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;41;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;15;8;12;25;16;14;12;11;13;10;12;13;13
144644;Huff;;12;22;13;10;13;13;12;12;13;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;35;40;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
N75782;Huff;;12;22;13;10;13;13;12;13;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;40;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
159126;Huff;;12;22;13;10;13;13;12;13;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;40;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
154442;Romansky;;12;22;13;9;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;29;14;15;15;16;11;9;19;19;15;14;16;16;34;41;12;11;11;8;15;17;8;11;10;8;11;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13
173856;huff;;13;22;13;10;13;13;12;12;12;13;15;29;18;9;9;11;11;25;14;19;30;14;15;15;16;11;9;19;19;15;14;16;16;34;42;12;11;11;8;15;17;8;11;10;8;13;11;22;22;17;11;12;12;16;8;12;25;16;14;12;11;13;10;12;13;13

По результатам обработки в калькуляторе Семаргла получены следующие результаты:
Цитировать
LINEAR ASD-METHOD
number of haplotypes: Nh = 22
number of markers: Nmrk = 66

number of mutations in all haplotype: ASDline = 1,79685716834
number of mutations in own marker: ASDlinemrk = 0,0272251086112

modal haplotype:
12,05 22,00 13,00 9,95 13,00 13,00 12,00 12,09 12,05 13,05 14,95 29,05 18,05 9,00 9,00 11,00 11,00 25,05 14,00 19,00 29,09 14,00 15,00 15,00 16,00 11,00 9,05 19,00 19,00 15,00 14,00 15,95 16,00 34,05 40,23 11,86 11,00 11,00 8,00 15,00 17,00 8,00 11,00 10,00 8,00 11,09 11,00 22,00 22,00 17,00 11,00 12,00 12,05 15,95 8,00 12,00 25,00 16,00 14,00 12,00 11,00 13,00 10,00 12,00 13,00 13,00

Цитировать
CLASSICAL ASD METHOD
number of haplotypes: Nh = 22
number of markers: Nmrk = 66

number of pairs (Nh*Nh-Nh)/2 m = 231
number of mutations in all haplotype: ASDc = 2,3961038961
number of mutations in own marker: ASDcmrk = 0,0363046044864

modal haplotype:
12,05 22,00 13,00 9,95 13,00 13,00 12,00 12,09 12,05 13,05 14,95 29,05 18,05 9,00 9,00 11,00 11,00 25,05 14,00 19,00 29,09 14,00 15,00 15,00 16,00 11,00 9,05 19,00 19,00 15,00 14,00 15,95 16,00 34,05 40,23 11,86 11,00 11,00 8,00 15,00 17,00 8,00 11,00 10,00 8,00 11,09 11,00 22,00 22,00 17,00 11,00 12,00 12,05 15,95 8,00 12,00 25,00 16,00 14,00 12,00 11,00 13,00 10,00 12,00 13,00 13,00

Далее, я использовал mutation rate для 67 маркеров, равную 0,002784.
Если честно, то маркеров было 66, так DYS425 с делецией я исключил.

Итого получено: 9,78 поколений до общего предка линейным методом и средний возраст популяции 13,04 поколения - классическим ASD-методом.
Если брать число лет в поколении равным 30 (а почему бы нет?), то получается 293 года в первом случае и 391 года - во втором.

Дальше начинается гадание на кофейной гуще. Предположим, что средний возрат людей, гаплотипы которых вошли в выборку 40 лет (вполне вероятно). Т.е. условная дата рождения последнего поколения - 1972 год.
Соответственно наши расчеты выводят нас на 1679 год - TMRCA линейным методом и 1581 год - "начало активного ветвления дерева". Что в принципе достаточно близко к фактическим годам жизни легендарного предка этого семейства - Derrick Pauluszen Hoff (1649-1730).
« Последнее редактирование: 05 Июнь 2012, 19:51:40 от Шад »

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6335
  • Страна: ru
  • Рейтинг +1333/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Не написал ради чего это все было затеяно.
В Мурке ветвление этого кластера начинается на 430+-176 годах. Т.е. по "кофейно-гущевому" методу расчета (приведенному выше) в 1542 году (2012 минус 40 минус 430).
Использовал -N 150.
Хотя, если использовать ту же mutation rate, что я брал для расчетов в калькуляторе это будет эквивалентно 28 годам на поколение... Да и какое количество брать в формуле - 67 маркеров или 66 (в связи с тем что я исключил делецию на DYS425)?
« Последнее редактирование: 05 Июнь 2012, 19:50:32 от Шад »

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Хочу поделиться своими наивными расчетами в калькуляторе Семаргла.
Пока нет мэтров, дам своё видение.
У Вас получилась 30% разница в кол.мут./мрк/поколение между парой классических методов. Хотя при верной выборке они должны как бы совпадать (у меня тоже часто ASD даёт выше). Считается, что такие случаи указывают на наличие "чужих". Поэтому я бы остановился на линейном результате. Далее - по Клёсову. Частота для 67-маркерных (новая)=0,00179. Значит делим 0,0272/0,00179=15 поколений. И умножаем на 25 лет (так калибровано)=375 лет.
     Вы же использовали, по-видимому, частоту 0,002784 из нашей статьи по смоделированным гаплотипам - она для реальных выборок не годится, там написано. Для калибровки же 0,00179 нужно брать только 25 лет.
     МВП не пойдёт, так как у Вас единая ветка. Хотя попробовать поискать ветви от корня можно - если таковые есть, то МВП даст более точный результат.

По Мурке сразу не вспомню. Нужно в мурочной теме посмотреть, что рекомендовано для 67 маркеров.

Там, похоже, так: Формула пересчёта: 1 rho=Возраст поколения (лет)/частоту мутаций (мутаций/локус/поколение)/число маркеров.
То есть, если ориентироваться опять же на Клёсова, то 25 лет/0,00179/67=208,45 (Valery рекомендовал Ро=175, но тогда не получится единообразия в расчётах с линейным методом).

Тут ещё нюанс - линия не обязательно пойдёт от патриарха Derrick Pauluszen Hoff(1649-1730). Большей частью до истинного предка может не дотягивать. Хотя в моём расчёте наоборот, возраст получился несколько завышен. Хотя, посчитайте погрешность (см. статью Адамова для "чайников" в RJGG? №1, 2010). Может быть и уложимся.

« Последнее редактирование: 05 Июнь 2012, 21:26:08 от Alexander »

Оффлайн Agni

  • Сообщений: 699
  • Рейтинг +30/-56
У меня небольшие знания в этом вопросе, но из моих наблюдений скорость мутаций в каждом Y-STR локусе своя.
Так может кто-нибудь знает были ли расчеты скоростей мутаций для каждого Y-STR локуса? И какие они дали результаты, если да.


 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.