• Добро пожаловать, Гость
news Новости: Поиск по гаплотипу, гаплогруппе, фамилии, географии, создание аккаунта, статистика. База данных Y-ДНК гаплотипов news

Автор Тема: Скорости мутаций по Мак-Доналдам по версии А.А. Клёсова.  (Прочитано 2678 раз)

0 Пользователей и 1 Гость смотрят эту тему.

OfflineАнТюр

  • default avatar
  • Rating 16
  • Сообщений: 600
  •  
Дело в том, что если в "обычной" постановке задачи мы не знаем время жизни первопредка, а пытаемся найти по вычисленному количеству мутаций, для чего, грубо говоря, УМНОЖАЕМ полученное количество мутаций на калибровочное значение скорости мутаций, то в случае применения данного алгоритма для калибровки, мы вычисленное количество мутаций ДЕЛИМ на известный интервал времени, который прошел от первопредка данной совокупности гаплотипов родственников. То есть, в центре и первой и второй задачи - один и тот же алгоритм вычисления среднего количества мутаций (со строгим учетом возвратных мутаций, между прочим!), только задача во втором случае как бы обратная.

Так я Вас и спашиваю, как Вы определите "вычисленное количество мутаций" при решении прямой и обратной задачи? Остальное мне вполне понятно.
Записан

OfflineКаржавин

  • default avatar
  • Rating 54
  • Сообщений: 669
  •  
Так я Вас и спрашиваю, как Вы определите "вычисленное количество мутаций" при решении прямой и обратной задачи? Остальное мне вполне понятно.
Методом максимального правдоподобия по совокупности гаплотипов, как это писано в параграфах 2.1 и 7.1. :)
Записан
Даже если ваше объяснение настолько ясно, что исключает всякое ложное толкование, все равно найдется человек, который поймет вас неправильно [следствие из 3-го закона Чизхолма]

OfflineАнТюр

  • default avatar
  • Rating 16
  • Сообщений: 600
  •  
Так я Вас и спрашиваю, как Вы определите "вычисленное количество мутаций" при решении прямой и обратной задачи? Остальное мне вполне понятно.
Методом максимального правдоподобия по совокупности гаплотипов, как это писано в параграфах 2.1 и 7.1. :)

Вы не можете найти методом максимального правдоподобия по совокупности гаплотипов количество случившихся мутаций.

Например, по совокупности гаплотипов Макдоналдов маркер DYS390 имеет значение 25 (в 61 случае) и 24 (в 7 случаях). Методом максимального правдоподобия даст 7 одношаговых мутаций. Между тем, все 7 маркеров DYS390, имеющих значение 24, могут восходить к одной мутации. Я Вас и спрашиваю. Каким образом, Вы определите, сколько мутаций маркера DYS390 случилось в роду Макдональдов? 7 или 1 или 3? Без обращения к их родословной, естественно. Мой ответ на этот вопрос прост. Такого способа в природе не существует.

Поэтому, предложенный Вами способ оценки скорости мутаций методом «накопления» оценок, полученных калибровкой на общего предка, работать не будет. Похоже, это специалисты понимают. Я просмотрел десятки статей по оценкам скоростей мутаций. Встретил всего 5 примеров оценки калибровкой на общего предка. По жителям Сардинии, по америндам, по цыганам, по полинезийцам и по Макдональдам.
Записан

OfflineКаржавин

  • default avatar
  • Rating 54
  • Сообщений: 669
  •  
Вы не можете найти методом максимального правдоподобия по совокупности гаплотипов количество случившихся мутаций.
Могу

Например, по совокупности гаплотипов Макдоналдов маркер DYS390 имеет значение 25 (в 61 случае) и 24 (в 7 случаях). Методом максимального правдоподобия даст 7 одношаговых мутаций. Между тем, все 7 маркеров DYS390, имеющих значение 25, могут восходить к одной мутации. Я Вас и спрашиваю. Каким образом, Вы определите, сколько мутаций маркера DYS390 случилось в роду Макдональдов? 7 или 1 или 3? Без обращения к их родословной, естественно. Мой ответ на этот вопрос прост. Такого способа в природе не существует.
Уважаемый АнТюр, здесь Вы неправильно интерпретировали механизм работы метода максимального правдоподобия, который я описал в параграфах 2.1 и 7.1, он не так работает. В Вашей интерпретации он точно работать не будет, и здесь я с Вами согласен.

Поэтому, предложенный Вами способ оценки скорости мутаций методом «накопления» оценок калибровкой на общего предка работать не будет. Похоже, это специалисты понимают. Я просмотрел десятки статей по оценкам скоростей мутаций. Встретил всего 5 примеров оценки калибровкой на общего предка. По жителям Сардинии, по америндам, по цыганам, по полинезийцам и по Макдональдам.
Я не знаю, чего понимают или не понимают другие специалисты. Наверное, Вы правы, а может быть и нет. Я как-то на этом не заморачивался, сидел себе и исследовал  :D
Записан
Даже если ваше объяснение настолько ясно, что исключает всякое ложное толкование, все равно найдется человек, который поймет вас неправильно [следствие из 3-го закона Чизхолма]

OfflineАнТюр

  • default avatar
  • Rating 16
  • Сообщений: 600
  •  
Вы не можете найти методом максимального правдоподобия по совокупности гаплотипов количество случившихся мутаций.
Могу

Например, по совокупности гаплотипов Макдоналдов маркер DYS390 имеет значение 25 (в 61 случае) и 24 (в 7 случаях). Методом максимального правдоподобия даст 7 одношаговых мутаций. Между тем, все 7 маркеров DYS390, имеющих значение 25, могут восходить к одной мутации. Я Вас и спрашиваю. Каким образом, Вы определите, сколько мутаций маркера DYS390 случилось в роду Макдональдов? 7 или 1 или 3? Без обращения к их родословной, естественно. Мой ответ на этот вопрос прост. Такого способа в природе не существует.
Уважаемый АнТюр, здесь Вы неправильно интерпретировали механизм работы метода максимального правдоподобия, который я описал в параграфах 2.1 и 7.1, он не так работает.

Это - "могу" и "неправильно интерпретируете" проверить легко. Нужно попросить у А. Клесова 6 маркерные гаплотипы Мак-Доналдов и обработать их опубликованным в статье способом.
« Последнее редактирование: 23 Сентября 2009, 12:33:15 от АнТюр »
Записан

OfflineКаржавин

  • default avatar
  • Rating 54
  • Сообщений: 669
  •  
Это - "могу" и "неправильно интерпретируете" проверить легко. Нужно попросить у А. Клесова 6 маркерные гаплотипы Мак-Доналдов и обработать их опубликованным в статье способом.
Неправильная интерпретация алгоритма, который у меня описан, никак не связана с тем, кто и как обрабатывает гаплотипы. Другое дело, что результат обработки той же самой партии гаплотипов Мак-Дональдов методом максимального правдоподобия будет несколько иным. Найду время и попробую тоже. Кстати, именно для всех желающих провести такую и аналогичные работы, я потратил кучу времени на подробнейшее описание алгоритма в статье: берите и прямо по нему пишите программу расчета. Единственное, что посоветую, писать программу на Дельфи, или на С++. Если использовать, скажем, Матлаб, то будет очень медленный скрипт.
Записан
Даже если ваше объяснение настолько ясно, что исключает всякое ложное толкование, все равно найдется человек, который поймет вас неправильно [следствие из 3-го закона Чизхолма]

OfflineMich Glitch

  • мтДНК отца Н
  • Rating 179
  • Сообщений: 3895
  • Y-ДНК: J2b1
  • мтДНК: Н6а1а
  • Y-ДНК (прадед, отец бабушки по маме): E1b1b1с1
  •  
Если использовать, скажем, Матлаб, то будет очень медленный скрипт.
Даже, если откомпилировать?
Сколько помню, в полном Матлабе есть опция, переписывающая всё в С. То есть можно создать независимый исполняемый файл и получить промежуточные исходные программы на С.
Записан
mtDNA: H6a1a (FGS)
mtSearch: F4G2B, XVND3
GenBank: HM019517
Y-DNA: J2b1-M205 (76 маркеров)
Отцовская линия мамы: E1b1b1a2*
Прадед (сторона мамы): E1b1b1c1-M35 (20 маркеров)
Ysearch: UA87M, YBJQW
DNAtribes: 27 маркеров
23andMe
FTDNA Family Finder

OfflineКаржавин

  • default avatar
  • Rating 54
  • Сообщений: 669
  •  
Если использовать, скажем, Матлаб, то будет очень медленный скрипт.
Даже, если откомпилировать?
Сколько помню, в полном Матлабе есть опция, переписывающая всё в С. То есть можно создать независимый исполняемый файл и получить промежуточные исходные программы на С.
А-а-а... Точно! Хотя, я пока не добрался до этой опции, но мои товарищи это с успехом делали. Мне лично проще такую несложную программу сразу в среде С++ написать: всего-то требуется консольное приложение без интерфейса (для себя зачем заморачиваться?). Правда, в Матлабе можно и интерфейс сделать, причем, с графическим отображением результатов, чего на С++ сделать не так просто.
Так что, всем желающим рекомендую именно такой предложенный путь:
- отладка и проверка на Матлабе (по малой выборке и с грубым шагом в численной процедуре),
- добавление красивого интерфейса (в Матлабе)
- перекомпилирование на С++.
Записан
Даже если ваше объяснение настолько ясно, что исключает всякое ложное толкование, все равно найдется человек, который поймет вас неправильно [следствие из 3-го закона Чизхолма]

OfflineGrigoriev

  • Администратор
  • *****
  • Rating 109
  • Сообщений: 2754
  • Y-ДНК: O3a3c
  • мтДНК: J1c
  • Потомок монгольского рода Атаганов
    • WWW
  •  
 ;)
А кто эти ВСЕ, которые это могут?

Цитировать
Так что, всем желающим рекомендую именно такой предложенный путь:
- отладка и проверка на Матлабе (по малой выборке и с грубым шагом в численной процедуре),
- добавление красивого интерфейса (в Матлабе)
- перекомпилирование на С++.

Нам бы, несведущим, готовое решение "поюзать". А вообще, вы ВСЕ конечно молодцы - вы и есть движители нашей новой науки!
Записан
Y-DNA: O3a3с (M117- M122+ M133- M134+ M162- P101-)
mtDNA: J1c* (HRV1:069T,126C; HRV2:73G,185A,228A,263G,295T,315.1C,462T,489C)
ySearch:64EF4

Gentis.ru - ДНК-генеалогическое тестирование
Российский Журнал Генетической Генеалогии

OfflineКаржавин

  • default avatar
  • Rating 54
  • Сообщений: 669
  •  
;)
А кто эти ВСЕ, которые это могут?

Цитировать
Так что, всем желающим рекомендую именно такой предложенный путь:
- отладка и проверка на Матлабе (по малой выборке и с грубым шагом в численной процедуре),
- добавление красивого интерфейса (в Матлабе)
- перекомпилирование на С++.

Нам бы, несведущим, готовое решение "поюзать".
Я, например, готов все исходные тексты программ выложить здесь для общего пользования, правда, всякие крики о неэкономности кода, корявом программировании буду посылать подальше, поскольку коды были написаны ТОЛЬКО ДЛЯ СЕБЯ, но работают правильно (проверял, но лишние проверки, конечно, всегда полезны).
А от непрофессионального программиста, пишущего программы только для своих исследований, требовать изящных кодов - это будет моветон! ;D
Записан
Даже если ваше объяснение настолько ясно, что исключает всякое ложное толкование, все равно найдется человек, который поймет вас неправильно [следствие из 3-го закона Чизхолма]

OfflineVVR

  • Rating 50
  • Сообщений: 375
  • Y-ДНК: R1a1
  •  
Новые объяснения АК. Не могу не прокомментировать.
Цитировать
АК пишет:
Надо же считать, и видеть, что данные Чандлера не годятся для расчетов. Возьмите данные клада Доналдов, например. Мы знаем, что их общий предок жил 650 лет назад (лорд Джон умер в 1386 году). Проверенный список из 68 их 12-маркерных гаплотипов (в 2007 году) содержал 44 мутации, 60 25-маркерных гаплотипов - 69 мутаций, 59 37-маркерных гаплотипов - 178 мутаций, и 26 67-маркерных гаплотипов - 98 мутаций. По моим данным имеем:

-- 44/68/0.022 = 29 поколений (29+/-5, если считать с погрешностями).
-- 69/60/0.046 = 25 поколений (25+/-4)
-- 178/59/0.09 = 34 поколения (34+/-4)
-- 98/26/0.145 = 26 поколений (26+/-4)

Поскольку я беру 25 лет на поколение, то 650 лет - это 26 поколений. Полученные величины сходятся с хронологией.

Посмотрим по Чандлеру. Его средние скорости мутаций равны 0.02243 (12-маркерные гаплотипы), 0.06953 (25-маркерные), 0.18208 (37-маркерные), 0.2243 (67-маркерные), и 0.2449 (78-маркерные), для 25 лет на поколение. То есть у него тоже должно получиться примерно 26 поколений. Проверяем:

-- 44/68/0.02243 = 29 поколений
-- 69/60/0.06953 = 16.5 поколений
-- 178/59/0.18208 = 17 поколений
-- 98/26/0.2243 = 17 поколений

Два немедленных вывода - у него не сшиваются 12-маркерные с остальными панелями (12-маркерные дают существенно завышенные данные по сравнению с остальными панелями), и 25-, 37- и 67- маркерные дают сильно заниженные данные. По ним общий предок Доналдов жил 17х25 = 425 лет назад, примерно в 1585 году. Какой уж там Лорд Джон, не говоря о Сомерледе!

Я уже писал, что Клёсов неверно считает скорости наборов маркеров по Чандлеру, считая маркеры палиндромных участков (кроме 425-го) дважды, 464-го четырежды.
Если пересчитать данные А.Клёсова по МакДоналдам для скоростей Чандлера получаем
-- 44/68/0.021 = 30,8 поколений
-- 69/60/0.049 = 23,5 поколений
-- 178/59/0.125 = 24,1 поколений
-- 98/26/0.165 = 22,8 поколений
Какие выводы.
1) У Клёсова не сшивается с остальными 3-я панель. Результат выходит за предложенные им же погрешности. По Чандлеру все скорости укладываются в эти погрешности (+-5 поколений на 12м и +-4 на остальных).
Это совершенно неудивительно. Если на всех 37м, это может быть не так заметно, то выделив собственно скорость 3-й панели(значения маркеров с 26-го по 37-й) мы получим. У Клёсова 0,09-0,046=0,044. У Чандлера 0,125-0,049=0,076. Кстати скорость 4-й панели (с 38-го по 67-й) у Клёсова 0,055,у Чандлера 0,040. А я то раньше всегда удиволялся, почему при расчёте квадратичным(ASD) методом,т.е. без влияния возвратных мутаций, 3-я панель всегда даёт больше мутаций, чем 4-я, а по скоростям  Клёсова должно быть наоборот.
2)25м,37м,67м по Чандлеру дают очень хорошее совпадение, но несколько заниженный результат. Можно было бы объяснить недостатком статистики или популяционным эффектом, но популяционный эффект тут должен быть совсем небольшим. МакДаналды хорошо размножались и оставили многочисленный клан. Не так давно я проводил моделирование(упрощённое конечно, не силён я в этом деле) подобной ситуации. От одного потомка шло 3 сына и далее в каждом поколении у каждого 3 сына. Маркер один. Быстрый. Скорость сейчас уже не помню. Вроде бы 0,01. 2-3 поколения возраста начинают выпадать почти сразу же на 6,7,8 поколениях реальных. И эта разница сохраняется в дальнейшем. Я считаю выпадают первые поколения, где ещё мало потомков и не прошла даже первая мутация. Надо бы ещё раз проверить.
Когда я привёл данные моделирования Клёсову, он естественно заявил, что это пустая теория, а у него реальная практика.
3)По Чандлеру явно выпадают первые 12м. В чём тут причина, пока не знаю. Может 12м дают недостаточную статистику. Может, какие-то особенности дерева мутаций. Надо разбираться.
Кстати, выпадают то они меньше чем 37м у Клёсова. Совершенно непонятно в чём заключалась его калибровка, если даже по его главному аргументу - генеалогии МакДоналдов результаты выходят за рамки погрешностей.
« Последнее редактирование: 21 Июля 2010, 22:17:46 от VVR »
Записан

Offlinewertner

  • Rating 73
  • Сообщений: 460
  • Y-ДНК: E1b1b1a2
  • мтДНК: U4a (xU4a3)
  •  
Возможно, что мутации стоит считать не от Лорда Джона, а от его деда, Lord Angus Mor MacDonald of Islay (1249-1293).
http://dna-project.clan-donald-usa.org/DNAmain3.htm
Ведь другая задокументированная линия есть только от прадеда Лорда Джона, она хорошо видна по отличиям в гаплотипах.
Записан
YSearch: EUAH6
Татарский ДНК-проект
Умею строить деревья: E1b1b1a2
Предиктор, новая бета-версия в процессе подготовки.
 

Rambler's Top100