АвторТема: Есть ли популяционный сдвиге в оценке ВБОП по кросс-ASD  (Прочитано 41096 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Nimissin

  • Сообщений: 2347
  • Рейтинг +724/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Теперь, результаты расчётов (100 прогонов восьми 100-маркерных гаплотипов) на 100 поколенях от предка со скоростью мутации m=0.002:
 
                     Задано     Получено         Поп. сдвиг           Ошибка   
 
TA                     80               60.17              20.00                19.83
TB                       60              49.76               10.00                10.24
T A+B                100              80.08               19.29               19.92
Интерклад      100              99.91                  0                    0.09
(А-В)2/m                            117.39       

Как видно, все три внутрикладовые BБОП дают предсказанное "популяционное" смещение с точностью до третьего  знака. Разницу вполне можно отнести за счёт стат.колебаний. Интерклад ошибки практически не даёт.
 
Теперь ещё раз пересчитаем кросс-оценку уже по формуле её "раскладки". При этом следует учесть, что я считал внутрикладовые  ВБОП по несмещённой формуле, а в "раскладке" - смещённая. Поэтому мои внутрикладовые величины нужно умножить на 0.75 (у нас 4 персоны в каждом кладе). Получаем:
 
Интеркладовый ВБОП = 0.5*(0.75*(60.17+49.76)  +  117.39) =  99.91
 
то есть то же, что и при "пермутационном" исчислении интерклада в таблице. Что в лоб, что по лбу...Итак выводы:
 
1. Внутрикладовый метод расчётов для "незвёздных" кластеров даёт популяционный сдвиг.
 
2. Этот сдвиг можно правильно предсказать, зная топологию дерева, по формуле SUMI(LIKI(KI-1))/(N(N-1)).
 
3. Кросс-дисперсия популяционного сдвига не даёт. Имеется лишь стат.разброс вокруг истинного значения.
 
4. Расчёт кросс-дисперсии классическим "пермутационным" методом (в лоб) или по её раскладке на компоненты (по лбу) даёт один и тот же результат.

Очень хороший пример. Сделаем расчет среднего возраста наугад взятой пары потомков по дереву Овода.
Клад А.
А1-А2 20 поколений
А1-А3 50
А1-А4 80
А2-А3 50
А2-А4 80
А3-А4 80
В среднем на 6 пар получается 60 поколений. Отсюда уважаемый Овод получает т.н. поп.сдвиг 80-60=20.
Клад В.
В1-В2 30 поколений
В1-В3 60
В1-В4 60
В2-В3 60
В2-В4 60
В3-В4 80
В среднем на 6 пар получается 50 поколений. Поп.сдвиг 60-50=10.
Аналогично, по 28 возможным парам общего дерева А+В, получается средний возраст 80.71, поп.сдвиг 19.29.
Замечу, что расчет сделан не по мутациям STR локуса, а непосредственно по заданному дереву.
Видно, что возрасты, оцененные Оводом по результатам розыгрыша мутаций на ребрах генеалогии, хорошо соответствуют среднему возрасту предка наугад взятой пары потомков. Этот вывод и был сделан в статье Адамова-Каржавина.

На этом пока все.

Оффлайн Clavis

  • Семенов Михаил Юрьевич
  • Сообщений: 1497
  • Страна: ru
  • Рейтинг +110/-0
    • https://m.vk.com/@clavis1953
  • Y-ДНК: G2a2 L1264
  • мтДНК: HV9, ранее известная как HV3a
Популяционный сдвиг в интеркладовых методах обязательно будет. В кросс-ASD это очевидно. Просто не дали сдвига в данном частном примере заданные мной условия, а именно бутылочное горлышко и неравномерность развития(увеличения численности) двух субкладов.
Ведь я заложил в модель, что до горлышка и после поп. эффекта нет. В реальности он обязательно будет и соответственно будет популяционный сдвиг.
В методе Клависа я пока "ухватить за хвост" и соответственно наглядно показать этот популяционный сдвиг не могу, но он тоже есть.
Я уже год повторяю очень простую вещь: пока объектом расчета возраста является пара гаплотипов, которая соединена простой, неразветвленной цепью звеньев отец-сын (а как ее разветвишь?), в ней нет места популяционным эффектам. Результат расчета обязательно будет занижен или завышен просто потому, что мутация - явление случайное, но ни закономерного завышения, ни закономерного занижения здесь быть не может. Если мы хотим рассчитать на дереве (рисунок: proba.JPG) возраст общего предка, мы имеем право брать пары А1-В1, А1-В2, А1-В3, А1-В4, А2-В1, А2-В2, А2-В3, А2-В4,  А3-В1, А3-В2, А3-В3, А3-В4, А4-В1, А4-В2, А4-В3, А4-В4 и только их. Одни дадут завышенный возраст (более 100 поколений), другие - наоборот, а среднее по всем парам будет стремиться к 100 по мере того, как мы будем обнаруживать на дереве новые гаплотипы и добавлять новые пары в расчет среднего возраста.
Может быть, я неправильно понял, но по моему убеждению именно этот принцип Нордтведт вложил в понятие interclade, по-русски говоря, меж двумя кладами.
Если же объектом расчета возраста является группа из более чем двух гаплотипов (например, A1-A4-B4), результат расчета всегда зависит от  топологии этой группы и избежать систематической ошибки расчета возраста можно только путем адекватного учета этой топологии (которая как правило нам заранее неизвестна, если только мы не придумали задачу сами).
« Последнее редактирование: 22 Декабрь 2010, 05:43:56 от Clavis »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.