АвторТема: Есть ли популяционный сдвиге в оценке ВБОП по кросс-ASD  (Прочитано 41830 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Каржавин

  • ...
  • Сообщений: 1806
  • Рейтинг +144/-2
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #60 : 24 Ноябрь 2010, 11:10:10 »
Давно пора. Там всё заржавело.

Только не надо ставить на рога нас, филогенистов.

Если можно, в ваших с Дмитрием статьях, давайте предложения, как ваши выводы приложить к вычислению возрастов в филогении.
Честно признаюсь, я уже моделировал модифицированную оценку TMRCA с учетом структуры дерева (поскольку я эти деревья моделировал, то структуру знаю!). Пока результат такой: популяционное смещение уменьшил, но разброс оценки увеличился, а это очень плохо, поскольку именно уменьшение разброса оценок - главная задача. Смещение мы всегда можем скомпенсировать соответствующими поправками (как это и было предложено в нашей статье с Адамовым), а вот разброс - никогда.
Причем, я специально прореживал финальное поколение, имитируя ограниченность выборки, которую мы используем как для анализа TMRCA, так и для построения филогении, ну и соответственно использовал ИСТИННОЕ дерево, которое объединяет ОГРАНИЧЕННУЮ выборку финальных потомков. В общем, пока все в тумане.

Да, чуть не забыл: всякие вариации методов оценки TMRCA на тему интеркладового метода Кена Нортведта ни хрена не дают. Обоснование этого напишу (там все очень просто).
« Последнее редактирование: 24 Ноябрь 2010, 12:04:17 от Каржавин »

Оффлайн Nimissin

  • Сообщений: 2375
  • Рейтинг +743/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #61 : 24 Ноябрь 2010, 12:50:42 »

Да, чуть не забыл: всякие вариации методов оценки TMRCA на тему интеркладового метода Кена Нортведта ни хрена не дают. Обоснование этого напишу (там все очень просто).
Мое мнение по поводу интеркладового метода более радикальное. Популяционные эффекты оказывают существенное влияние даже для случая возраста общего предка двух отдельно взятых гаплотипов.

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1785
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #62 : 24 Ноябрь 2010, 18:13:41 »

Да, чуть не забыл: всякие вариации методов оценки TMRCA на тему интеркладового метода Кена Нортведта ни хрена не дают. Обоснование этого напишу (там все очень просто).
Мое мнение по поводу интеркладового метода более радикальное. Популяционные эффекты оказывают существенное влияние даже для случая возраста общего предка двух отдельно взятых гаплотипов.

Хотелось бы услышать оба мнения: и то, по которому кросс-дисперсия "ни хрена не даёт" и "более радикальное". Хотя бы с минимальной аргументацией. Конечно же - интеркладовый метод не панацея. Но откуда там "популяционное влияние"?

Другое дело, что однонаправленные мутации в одном и том же маркере, если они произошли в общей ветви каждого из кладов не будут учитываться (поскольку истинно предковый гаплотип нам неизвестен). В результате возраст общего предка будет занижен. Но это не "популяционный", а чисто статистический эффект, сродни возвратным мутациям (с которыми мы умеем бороться).
« Последнее редактирование: 24 Ноябрь 2010, 20:12:47 от Овод »

Оффлайн Grigoriev

  • Администратор
  • *****
  • Сообщений: 3116
  • Страна: ru
  • Рейтинг +187/-3
    • Молекулярная генеалогия
  • Y-ДНК: O3a3c
  • мтДНК: J1c
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #63 : 25 Ноябрь 2010, 00:08:38 »
Если можно, в ваших с Дмитрием статьях, давайте предложения, как ваши выводы приложить к вычислению возрастов в филогении.
Очень верно подмечено! И чем конкретнее они будут, чем проще их будет найти в тексте статьи, тем лучше для всех.

Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #64 : 25 Ноябрь 2010, 00:40:30 »
Очень интересно будет почитать мнение Адамова и Каржавина.
Я вот сейчас пытаюсь оценить возраст "венедской" ветви и входящих подветвей разными методами - квадратичным дисперсионным, линейным, ро-статистикой по своему дереву, с разбиением на ветви и без. В том числе считал и интеркладовым(кросс-дисперсионным) методом Нодтведа. Казалось бы, чего проще - введи данные в таблицу Нордтведа и получи результат. Но поскольку я человек в возрасте, со старым мышлением, не привыкший дверять непонятным мне программам, то считал почти вручную, рассматривая этот и другие методы с разных сторон. И нашёл способ расчёта методом Нордтведа, отличный от суммирования квадратов разностей значений гаплотипов одной ветви и значений другой ветви. Этот способ наглядно показывает математическую(и генеалогическую) сущность интеркладового метода.

Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #65 : 25 Ноябрь 2010, 00:41:03 »
Продемонстрирую на примере двух ветвей(субкладов) и с одним маркером.
Ветвь А с значениями 15,15,16,16,16,17.
Ветвь B с значениями 17,17,17,17,17,18,20.
1)Считаю средн.арифм. модал ветви А
(15+15+16+16+16+17)/6=15,83
2)Считаю сумму разностей квадратов значений и ср.арифм.модала.
(15-15,83)в квадрате х2 + (16-15,83)в квадр.х3 + (17-15,83)в квадр. х1 = 2,8334
3)Делю на количество гаплотипов в ветви.
2,8334/6=0,4722
Если разделить эту величину на скорость мутации получим возраст ветви А в поколениях, т.е. фактически я посчитал возраст А квадратичным методом.
4)ветвь В (аналог п.1)
(17х5+18+20)/7=17,57
5)ветвь В аналог.п.2
(17-17,57)в квадр. х5 + (18-17,57)в квадр. + (20-17,57)в квадр. = 3,8543
6) аналог.п3
3,8543/7=0,5506
7)Квадрат разности значений ср.арифм. модалов А и В
(15,83-17,57)в квадр.=3,0276
8) Суммируем п.п. 3,6,7 и делим пополам
(0,4722+0,5506=3,0276)/2=2,0252
9) Делим эту величину на скорость мутации маркера - получаем  интеркладовый возраст в поколениях. Возвратные мутации естественно учтены.
Если маркеров не один, аналогично считаем количество мутаций на каждом маркере как в п.8, суммируем и делим на скорость мутации гаплотипа(сумму скоростей мутации просчитываемых маркеров).

Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #66 : 25 Ноябрь 2010, 00:42:01 »
Что у нас получается с точки зрения ДНК-генеалогии. Мы расстояние от современника ветви А до БОП ветви А складываем с расстоянием от БОП А до БОП В (между виртуальными(ср.арифм.) модалами ветвей), проходящим через виртуального БОП обеих ветвей и складываем с расстоянием от БОП ветви В до современника ветви В. Затем всю эту сумму делим пополам и плучаем интеркладовый возраст по методу Нордтведа.
То что в возраста ветвей А и В рассчитанные квадратичным дисперсионным методом нужно вводить популяционную поправку, Адамов и Каржавин уверенно показали в своей работе. И даже рассчитали её величину. Возникает вопрос, какая популяционная поправка должна быть при расчёте возраста по двум модальным гаплотипам. Как правило считают, что по двум гаплотипам вообще не рекомендуется считать, т.к. погрешности могут быть очень большими.Может быть как занижение возраста(чаще), так и завышение.Ведь БОПы ветвей - это выжившие и давшие потомство до наших дней после бутылочного горлышка. Значения их маркеров могут случайным образом отличаться от средних значений, тех кто не выжил или не оставил потомства, дожившего до наших дней.
Но фактически именно такой расчёт и является одной из составляющих метода Нордтведа.

Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #67 : 25 Ноябрь 2010, 00:42:32 »
Таким образом видно, что этот метод имеет большие погрешности. Также искажают оценку возраста квадратичными методами (дисперсионным и кросс-дисперсионным) RecLOH и многошаговые мутации. Именно поэтому Нордтвед исключил из расчётов большинство палиндромных маркеров(непонятно, почему не все), т.к. они дают RecLOH. Но исключить многошаговые мутации не получается. При большом количестве гаплотипов и маркеров это мало  заметно, но если RecLOH или многошаговая мутация пройдёт между двумя ветвями, это явно завысит интеркладовый возраст.

Оффлайн VVR

  • ...
  • Сообщений: 2462
  • Страна: ua
  • Рейтинг +616/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #68 : 25 Ноябрь 2010, 00:42:56 »
Я не проверял, но логически из моих расчётов следует, что  если считать методом Нордтведа по нескольким ветвям, имеющим общего предка, то можно сложить возраста всех ветвей, посчитанные квадратичным методом, с возрастом по ср.арифм. модалам всех ветвей и разделить на количество ветвей.



Оффлайн Nimissin

  • Сообщений: 2375
  • Рейтинг +743/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #69 : 25 Ноябрь 2010, 07:14:33 »
Хотелось бы услышать оба мнения: и то, по которому кросс-дисперсия "ни хрена не даёт" и "более радикальное". Хотя бы с минимальной аргументацией. Конечно же - интеркладовый метод не панацея. Но откуда там "популяционное влияние"?

Уважаемый Овод, по поводу оценки возраста общего предка двух субкладов методом кросс-дисперсии есть практически завершенный текст Сергея Каржавина, который я по очевидным причинам не имею права обнародовать. Могу только сказать, что "интеркладовая" дисперсия меньше истинной дисперсии вследствие наличия корреляций внутри каждого отдельного субклада. Чем меньше популяция субклада, тем сильнее корреляция, тем больше занижается возраст. Думаю, Сергей будет только приветствовать, если Вы присоединитесь к нашему внутреннему обсуждению до выхода статьи Сергея. "Более радикальное мнение" об оценке возраста общего предка двух гаплотипов - это пока только мое мнение. Давайте сначала разберем случай двух субкладов.

Оффлайн Nimissin

  • Сообщений: 2375
  • Рейтинг +743/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #70 : 25 Ноябрь 2010, 07:45:34 »
Продемонстрирую на примере двух ветвей(субкладов) и с одним маркером.
Ветвь А с значениями 15,15,16,16,16,17.
Ветвь B с значениями 17,17,17,17,17,18,20.
1)Считаю средн.арифм. модал ветви А
(15+15+16+16+16+17)/6=15,83
2)Считаю сумму разностей квадратов значений и ср.арифм.модала.
(15-15,83)в квадрате х2 + (16-15,83)в квадр.х3 + (17-15,83)в квадр. х1 = 2,8334
3)Делю на количество гаплотипов в ветви.
2,8334/6=0,4722
Если разделить эту величину на скорость мутации получим возраст ветви А в поколениях, т.е. фактически я посчитал возраст А квадратичным методом.
4)ветвь В (аналог п.1)
(17х5+18+20)/7=17,57
5)ветвь В аналог.п.2
(17-17,57)в квадр. х5 + (18-17,57)в квадр. + (20-17,57)в квадр. = 3,8543
6) аналог.п3
3,8543/7=0,5506
7)Квадрат разности значений ср.арифм. модалов А и В
(15,83-17,57)в квадр.=3,0276
8) Суммируем п.п. 3,6,7 и делим пополам
(0,4722+0,5506=3,0276)/2=2,0252
9) Делим эту величину на скорость мутации маркера - получаем  интеркладовый возраст в поколениях. Возвратные мутации естественно учтены.
Если маркеров не один, аналогично считаем количество мутаций на каждом маркере как в п.8, суммируем и делим на скорость мутации гаплотипа(сумму скоростей мутации просчитываемых маркеров).
Вы абсолютно правы, уважаемый VVR!
Действительно, интеркладовая дисперсия Dab = (1/2)*(Da + Db + (<ma> - <mb>)^2). Вот об этом обстоятельстве и говорит уважаемый Каржавин в своем тексте (формула (8 )).
Далее, подвержены ли популяционным эффектам эти величины?
Da и Db, собственные дисперсии субкладов - да, подвержены. См. статью Адамова-Каржавина.
Разница средних значений аллелей субкладов - да, подвержена в случае смещения от истинного  предкового значения. Тут влияют и дробные части.
Замечу, что если все дисперсии и квадраты заменить на возрасты, подсчитанные линейным методом с учетом возвратных мутаций, то получается известная формула, по которой считают уважаемый Clavis и АК:
T=(1/2)*(Ta + Tb + Tab), Tab - расстояние между предковыми гаплотипами кладов a и b.
« Последнее редактирование: 25 Ноябрь 2010, 08:08:14 от Nimissin »

Оффлайн Nimissin

  • Сообщений: 2375
  • Рейтинг +743/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #71 : 25 Ноябрь 2010, 07:57:25 »
Что у нас получается с точки зрения ДНК-генеалогии. Мы расстояние от современника ветви А до БОП ветви А складываем с расстоянием от БОП А до БОП В (между виртуальными(ср.арифм.) модалами ветвей), проходящим через виртуального БОП обеих ветвей и складываем с расстоянием от БОП ветви В до современника ветви В. Затем всю эту сумму делим пополам и плучаем интеркладовый возраст по методу Нордтведа.
То что в возраста ветвей А и В рассчитанные квадратичным дисперсионным методом нужно вводить популяционную поправку, Адамов и Каржавин уверенно показали в своей работе. И даже рассчитали её величину. Возникает вопрос, какая популяционная поправка должна быть при расчёте возраста по двум модальным гаплотипам. Как правило считают, что по двум гаплотипам вообще не рекомендуется считать, т.к. погрешности могут быть очень большими.Может быть как занижение возраста(чаще), так и завышение.Ведь БОПы ветвей - это выжившие и давшие потомство до наших дней после бутылочного горлышка. Значения их маркеров могут случайным образом отличаться от средних значений, тех кто не выжил или не оставил потомства, дожившего до наших дней.
Но фактически именно такой расчёт и является одной из составляющих метода Нордтведа.
Полностью с Вами согласен, см. мой предыдущий пост. Считаю, что популяционная поправка при расчете возраста общего предка двух модальных гаплотипов зависит от общей численности каждого субклада. Почему-то сторонники "чистого" метода кросс-дисперсии забывают о классической статье Брюса Уэлша 2002 года, в которой автор считает и влияние эффективной численности популяции Ne.
« Последнее редактирование: 25 Ноябрь 2010, 08:09:20 от Nimissin »

Оффлайн Nimissin

  • Сообщений: 2375
  • Рейтинг +743/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #72 : 25 Ноябрь 2010, 07:59:00 »
Таким образом видно, что этот метод имеет большие погрешности. Также искажают оценку возраста квадратичными методами (дисперсионным и кросс-дисперсионным) RecLOH и многошаговые мутации. Именно поэтому Нордтвед исключил из расчётов большинство палиндромных маркеров(непонятно, почему не все), т.к. они дают RecLOH. Но исключить многошаговые мутации не получается. При большом количестве гаплотипов и маркеров это мало  заметно, но если RecLOH или многошаговая мутация пройдёт между двумя ветвями, это явно завысит интеркладовый возраст.

Вот почему линейный метод имеет право на жизнь. Хотя теоретически имеет большую погрешность, чем метод ASD.

Оффлайн Nimissin

  • Сообщений: 2375
  • Рейтинг +743/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #73 : 25 Ноябрь 2010, 08:06:02 »
Я не проверял, но логически из моих расчётов следует, что  если считать методом Нордтведа по нескольким ветвям, имеющим общего предка, то можно сложить возраста всех ветвей, посчитанные квадратичным методом, с возрастом по ср.арифм. модалам всех ветвей и разделить на количество ветвей.



Вам это надо проверить, но похоже на правду. Но на практике лучше анализировать субклады по парам. У каждого субклада может быть своя дополнительная уникальная информация.

Оффлайн Каржавин

  • ...
  • Сообщений: 1806
  • Рейтинг +144/-2
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #74 : 25 Ноябрь 2010, 10:38:16 »
Хотелось бы услышать оба мнения: и то, по которому кросс-дисперсия "ни хрена не даёт" и "более радикальное". Хотя бы с минимальной аргументацией. Конечно же - интеркладовый метод не панацея. Но откуда там "популяционное влияние"?
В свое время я Вам послал кое-какой материал (на  другую тему) для ознакомления и получил ответ, смысл которого примерно следующий: очень много написано, больше чем в докторской диссертации, которую Вы в то время изучали, и у Вас нет времени (прошло уже более полугода). Второй раз получать "отлуп" на написанный специально для Вас текст мне неохота. Тем не менее, думается, в на Ваши вопросы скоро будут даны исчерпывающие ответы в готовящейся публикации.
Кстати, непрочитанный Вами материал во многом уже устарел, поскольку это были некие начальные мысли, и его уже можно не просматривать.

Другое дело, что однонаправленные мутации в одном и том же маркере, если они произошли в общей ветви каждого из кладов не будут учитываться (поскольку истинно предковый гаплотип нам неизвестен). В результате возраст общего предка будет занижен. Но это не "популяционный", а чисто статистический эффект, сродни возвратным мутациям (с которыми мы умеем бороться).
Никаких "возвратных мутаций" не существует. Просто есть мутации, приводящие к уменьшению или увеличению аллели. Поэтому борьба с искусственно созданными объектами, коими являются "возвратные мутации" с точки зрения качества оценки TMRCA не может быть эффективной. Это все уже опубликовано в нескольких работах, и надо просто ознакомиться с этими результатами.
Влияние ошибок оценки предкового гаплотипа будет полностью объяснено в готовящейся публикации. Можно только заметить, что какой то особый "статистический эффект" здесь ни при чем, просто это результат "обычного" случайного ветвящегося процесса развития популяции, на который наложены мутации.

Так сказать, алаверды:

Только что прочитал на Родство пост уважаемого Clavis'a, касающийся проблемы расчета TMRCA:
Другое дело, когда мы соединяем цепочкой два современных гаплотипа, перекидывая цепочку через общего предка. Если мы соединили родных братьев, в цепочке два звена, если двоюродных - четыре звена, стоюродных - двести звеньев. При этом цепочка будет абсолютно одинакова по свойствам (вероятность сохранения исходного гаплотипа, гистограмма числа мутаций, средневероятное количество наблюдаемых и истинно произошедших мутаций) в обоих случаях: между N-юродными братьями или между потомком и его предком 2N поколений назад.
В первом случае мы имеем два надежно зафиксированных конца, например, два 67-маркерных гаплотипа, остается посчитать это N. Но и в случае 67 маркеров точность расчета оставляет желать лучшего.
Однако в базах данных можно найти для каждого из N-юродных братьев более близких родственников, например, по числу мутаций между ними. Получается, от предка пошли две линии, которые потом разветвились: в одном случае на n тестированных потомков, в другом случае на m потомков. Значит, через этого общего предка можно провести mn неразветвленных цепочек, и в каждой будет свое число мутаций, и даже своё число поколений (которое мы, не имея родословной росписи, в точности не знаем). А что общего во всех цепочках? Их длина в годах: от современности до времени жизни общего предка плюс обратно до современности. Значит, один и тот же интервал времени мы можем рассчитать по числу мутаций mn раз, что значительно повысит точность противу однократного расчета.


Все очень доходчиво и правильно написано по поводу механизма усреднения данных по парам цепочек (использование такого метода было описано в http://rjgg.molgen.org/index.php/RJGGRE/article/view/43). Но при этом "популяционный сдвиг" НИКУДА НЕ ИСЧЕЗНЕТ. Будет найдено всего лишь СРЕДНЕЕ время общего предка наугад взятой пары финальных потомков (этот термин введен также в http://rjgg.molgen.org/index.php/RJGGRE/article/view/43 , страница 54), но это не TMRCA начального предка!!! Это явление полностью исследовано и с помощью статистического моделирования, так что вопросов здесь практически нет никаких. Окончательное разъяснение будет скоро представлено в соответствующей публикации.
« Последнее редактирование: 25 Ноябрь 2010, 11:54:00 от Каржавин »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.