АвторТема: Есть ли популяционный сдвиге в оценке ВБОП по кросс-ASD  (Прочитано 44797 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн CenturionАвтор темы

  • 100% Earth (Solar System) genofond
  • Администратор
  • *****
  • Сообщений: 9548
  • Страна: ru
  • Рейтинг +571/-2
"Таким образом, пределы применимости линейного метода и ASD-метода в задаче вычисления TMRCA имеет диапазон применимости от 50-ти до 500 поколений."
« Последнее редактирование: 21 Декабрь 2010, 23:05:24 от Овод »

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Цитировать
Подтверждена жесткая связь оценки TMRCA со средней глубиной общего предка наугад взятой пары финальных потомков. Оказалось, что применение метода ASD без учета численности финальной попу-
ляции фактически соответствует расчету не времени жизни начального предка, а средней глубины общего предка наугад взятой пары потомков.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Цитировать
Древность родовой популяции. Данный параметр имеет ограничение как «сверху», так и «снизу». Наиболее молодое генеалогическое дерево, для которого можно оценить время жизни начального предка, не должно быть моложе 25 поколений (не позднее XV века), поскольку для более молодых
деревьев даже на «быстрых» маркерах накапливается слишком мало статистики по мутациям. Для древних генеалогических деревьев, напротив, статистики по мутациям много,но все более вероятно, что начальный период «отрезан» схлопываниями бутылочных горлышек, особенно если объем родовой попу-
ляции, несмотря на древность, мал. Также с удревнением генеалогического дерева все хуже точность вычисления предкового аллеля. Учитывая ранее приведенные численные оценки, наибольшая глубина генеалогического дерева, доступная исследованным в данной работе методам оценки TMRCA, не пре-
вышает 500 поколений (8 тыс. лет до н.э.).Наихудшее сочетание свойств исследуемого  генеалоги-ческого дерева (совокупности гаплотипов): малочисленный и при этом древний субклад.

Оффлайн Clavis

  • Семенов Михаил Юрьевич
  • Сообщений: 1495
  • Страна: ru
  • Рейтинг +111/-0
    • https://m.vk.com/@clavis1953
  • Y-ДНК: G2a2 L1264
  • мтДНК: HV9, ранее известная как HV3a
Ограничение метода в применении некими рамками - признак того, что ради простоты формулы пренебрегли точностью, и с какого-то рубежа отклонение от правильного значения становятся уже нетерпимым.
Если формула точная, она не требует ограничений. Представьте себе такую формулировку:  "Сумма квадратов двух  катетов равна квадрату гипотенузы, если один из катетов не превосходит другой более чем в десять раз".
Наверное, при таком решении задачи ныне про Пифагора помнили бы только большие знатоки греческой истории?  :P
« Последнее редактирование: 15 Июль 2010, 16:28:34 от Clavis »

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Ув.Clavis,
Если же Вы не учитываете этот важный момент ограниченности метода, то наш спор с Вами представлает бессмысленное упражнение в схоластических кунштюках типа, спора об универсалиях и номиналиях, типа этого:
Цитировать
Идея исключения абстракций стала одной из центральных идей современного математического номинализма — особой точки зрения на основания математики, возникшей в начала XX в.в Польше (С. Лесьневский, Л. Хвистек, Т. Котарбиньский, А. Тарский и др.), США (Н. Гудмен, У. Куайн, Л. Генкин, Р. Мартин) и в др. странах в ответ на известное возрождение платонизма в концепциях теории множеств, в особенности на ничем не ограниченное введение абстракций как сущностей (см. Абстракции принцип), которое ведёт к парадоксам.

Математические номиналисты предприняли ряд попыток построить математику без парадоксов, основываясь на идее использования формальных систем (формальных языков), в терминах которых удаётся выразить многие абстракции математики и таким образом исключить их, заменив соответствующей «языковой моделью». Логика, лежащая в основе этих систем, понимается при этом в духе номиналистической традиции: существуют («первично», «сами по себе», вне мышления и речи) только чувственно воспринимаемые индивиды, и только они (их собственные имена или дескрипции) могут быть значениями предметных переменных логического языка, образуя истинный «универсум рассуждения» (предметную область) любой научной теории. Поэтому единственной приемлемой с точки зрения номинализма логикой является узкое исчисление предикатов (см. Логика предикатов). Номиналистическая программа в известной мере обосновывается теоремой Крейга об устранимости абстрактных терминов из языка любой научной теории [2], однако полная практическая реализация этой программы представляется неосуществимой

Оффлайн Clavis

  • Семенов Михаил Юрьевич
  • Сообщений: 1495
  • Страна: ru
  • Рейтинг +111/-0
    • https://m.vk.com/@clavis1953
  • Y-ДНК: G2a2 L1264
  • мтДНК: HV9, ранее известная как HV3a
Все приведеные Вами примеры связаны с качественным переходом.
И, в принципе, не противоречат сказаному мной. Все формулы релятивистской физики, если скорости далеки от скорости света, дают те же результаты, что и формулы Ньютона. То есть формулы Ньютона - это упрощенные релятивистские формулы, они годятся при ограниченных условиях. Если бы мы сразу применили релятивистские, не пришлось бы накла ограничение в скорости.
Другой пример: Эвклидова геометрия на поверхности земной сферы. Пока кривизна сферы ничтожна, годится и Эвклид. В глобальных масштабах нужна сферическая геометрия, но уж у нее-то нет ограничений в масштабе. Пока не выйдем из сферической поверхности.
К чему я клоню? решение проблемы TMRCA есть, просто то, что сейчас используется - упрощенный вариант универсальной формулы. Эвклидова трактовка геометрии Лобачевского.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Цитировать
То есть формулы Ньютона - это упрощенные релятивистские формулы, они годятся при ограниченных условиях.

Подтверждение моего умозаключения, только другими словами

Цитировать
О точности формулы (метода) можно судить только в (ограниченных) рамках применяемого метода.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Другой пример: Эвклидова геометрия на поверхности земной сферы. Пока кривизна сферы ничтожна, годится и Эвклид. В глобальных масштабах нужна сферическая геометрия, но уж у нее-то нет ограничений в масштабе. Пока не выйдем из сферической поверхности.
К чему я клоню? решение проблемы TMRCA есть, просто то, что сейчас используется - упрощенный вариант универсальной формулы. Эвклидова трактовка геометрии Лобачевского.

А если речь идет о размерности измерений > 3 (например, гиперкуб-тессеракт или пентеракт) ? :)

Опять повторюсь, универсальных формул не бывает. Поэтому Ваша аналогия с Эвклидовой трактовской геометрии неприменима в случае с TMRCA.

Оффлайн Clavis

  • Семенов Михаил Юрьевич
  • Сообщений: 1495
  • Страна: ru
  • Рейтинг +111/-0
    • https://m.vk.com/@clavis1953
  • Y-ДНК: G2a2 L1264
  • мтДНК: HV9, ранее известная как HV3a
Цитата: Vadim Verenich link=topic=1688.msg51264#msg51264

Опять повторюсь, универсальных формул не бывает.
Ну зачем же так категорично?
Пи-эр- квадрат годится для любого радиуса без ограничений.
Но наш ряд аналогий себя исчерпал, перейдем к конкретному вопросу. Чем нас не устраивает результат расчета (оценки) TMRCA, когда прошли рубеж 500 поколений:
1) чрезмерно завышен возраст;
2) чрезмерно занижен возраст;
3) в среднем возраст правилен, но чрезмерно высока погрешность, то есть разница между результатом и тем возрастом, который мы ожидаем исходя из иных соображений;
4) мы не знаем вообще, происходит ли занижение или завышение возраста, и эта неизвестность настораживает.
Цитировать
Также с удревнением генеалогического дерева все хуже точность вычисления предкового аллеля
А хуже точность - меняет возраст в каком направлении? Завышения или занижения возраста? и зачем он нужен, этот предковый аллель? Тупо определили дисперсию и тупо по дисперсии определили возраст, так во всех статьях, они же не гадают, какой аллель был у предка?
« Последнее редактирование: 15 Июль 2010, 18:34:03 от Clavis »

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Потому что линейный метод Клесова опирается на подсчет наблюдаемого числа мутаций от предпологаемого предкового (модального) значения аллеля. Это наблюдаемое число мутаций затем калибрируется по таблице возвратных мутаций (или по формуле Адамова). Следовательно, с удревнением генеалогического дерева достоверность модального гаплотипа уменьшается.

Логично.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #10 : 15 Июль 2010, 18:46:16 »
При ASD методе это не столь критично. Еще менее это критично в методе Нордведта, которые в своем чистом виде не требует установление модального гаплотипа. И он же не завязан на демографически-популяционных эфектах (и структуре филогенетического дерева). Зато - как было показано в теме Расчёт возраста предка двух субкладов  этот метод очень сильно зависит от статистических особенностей выборок попарно сравниваемых гаплотипов двух разных субкладов.
« Последнее редактирование: 15 Июль 2010, 18:58:31 от Vadim Verenich »

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #11 : 15 Июль 2010, 18:54:41 »
Придется еще раз процитировать Игоря

Вы совершенно правильно заметили, что, поскольку мы имеем дело не с одним маркером, а с многими, то какие-то уже проходили повторно предковое значение, а какие-то - нет. Беда, однако, в том, что поскольку с ростом возраста настоящего предка маркеров с "повторами" становится больше, а сами повторы в некоторых - неоднократнее, то "статистика" всё более "омолаживает" возраст. Так, если Вы попытаетесь по СТР маркерам определить, скажем ответвление шимпанзе от рода "хомо", то вместо даказанных миллионов лет получите, в лучшем случае, сотню тысяч.
.....
Что же касается зависимости от выборки - я же вроде как объяснял. Но еще раз, по аналогии с двумя стеблями столь любимого Вам укропа (для которого расстояние между двумя тычинками соседних стеблей действительно не очень разнится между любыми другими парами). Ведь дерево гаплотипов любой гаплогруппы, это скорее не "укроп", а березка или кипарис, у которых есть как более нижние, так и более высокие ветки. И расстояние между парами высоких или низких ветвей на разных стволах будет разным. А поскольку каждая гаплогруппа имеет свою статистику ветвлений, не похожую на другие, то и пары сравнений будут случайно зависеть от выбранных для сравнения ветвей. То есть - от выборки.
 
Собственно, этот вопрос уже не раз был доказан аналитически, без аналогий, на разных популяционных моделях. Это не значит, что пермутационный метод нельзя применять - напротив, он очень хорош тем, что "отстраивается" от дрейфа. И на моложых субкладах "кроны" он хорош. Но за равномерностью выборки нужно следить очень тщательно, и Вай-серч, в котором есть колоссальные диспропорции по представительству разных гаплогрупп и их субкладов - не лучший гарант её равномерности и представительности.


О методе "неопределённый аллелей", о котором Вы упоминаете у меня даже и речи нет. Его можно использовать (а иногда и должно) только на самых молодых возрастах (еденичные мутации на 67-маркерном гаплотипе, например). В этих условиях он хорошо фильтрует возможные единовременно-многошаговые мутации.

..........


Но и линейный метод с поправками, который, очевидно, применили Вы, также имеет свои предельно-допустимые возраста для расчёта. По-моему, в статье Адамова он обозначен как не более 0.8 "видимых" мутаций на маркер.
 
Мутирование же гаплотипов разных базовых гаплогрупп превышает этот предел. Отсюда - ошибка. Тут дело не в рекомендованных кем-то скоростях, а в принципиальном подходе.



Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #12 : 15 Июль 2010, 18:57:11 »
От себя добавлю. Игорь говорил о том, что границы применения пермутационного доказаны аналитическим способом. Теперь - после работы Каржавина-Адамова - имеем подтверждение и путем компьютерного моделирования.

Оффлайн VVR

  • ...
  • Сообщений: 2456
  • Страна: ua
  • Рейтинг +618/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #13 : 16 Июль 2010, 01:22:33 »
Пермутационный и ASD - одно и то же. Или речь о каком-то другом пермутационном методе?

Оффлайн Nimissin

  • Сообщений: 2400
  • Рейтинг +759/-0
  • Y-ДНК: N-M178 L839+ P298+ M2019+ M2118+ M1991+ M1988+
  • мтДНК: C4b12a
Re: О популяционном сдвиге в оценке кросс-ASD
« Ответ #14 : 16 Июль 2010, 01:31:29 »
Пермутационный и ASD - одно и то же. Или речь о каком-то другом пермутационном методе?

Один из вариантов метода ASD совпадает с пермутационным. Если квадратичные отклонения считаются относительно среднего (дробного!) значения аллеля по выборке. Полученное значение еще называют "variance" в отличие от другого варианта, в котором квадратичные отклонения считаются относительно предкового (только целого!) значения аллеля. Есть и другие варианты расчета ASD.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.