АвторТема: Усреднённые возрасты и доверительные интервалы  (Прочитано 2699 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Valery

  • Сообщений: 7430
  • Страна: 00
  • Рейтинг +860/-6
  • Ultimate Matriarchy
Если эту логику проводить последовательно то в пределах 1 выборки сделанной на одном оборудовании 1 автором вообще не определить вымершие клады, даже при глубине чтения снипов более 1. Надо чтобы два автора опубликовали древние сиквенсы, с пересечением приватов, и вот это пересечение уже как-то смотрится пристойно.

Вообще для сиквенсов с артефактами характерны ложные клады. Скажем, вы берете выборку современных образцов, в которой есть родственные, и у вас могут появляться ложные клады. Вы исключаете все снипы, ведущие себя нехорошо - мутирующие параллельно или обратно - но вы таким способом не исключите ложный снип у двух родственных образцов A1, A2 в условиях когда на самом деле они не более одственны чем их соседи на ветке A3, A4,.... То есть вывод - надо мыть снипы заранее )) YFull тем хороша что умеет мыть и не выплескивать ребенка из ванночки  ;D

Оффлайн Valery

  • Сообщений: 7430
  • Страна: 00
  • Рейтинг +860/-6
  • Ultimate Matriarchy
По идее от даты зачатия.)

как возбудятся пролайферы, прочитав сие  ;D
вот скажут - жизнь начинается с..

Оффлайн Valery

  • Сообщений: 7430
  • Страна: 00
  • Рейтинг +860/-6
  • Ultimate Matriarchy
Валер, тут не совсем так. Дело в том, что у нас требование - покрытие bed'a более 70%.

я на самом деле имел в виду не только пересечение (малое чревато упущенными снипами там где nocall) но и разный набор артефактов разных платформ - то есть увеличением ложноположительности. Два набора платформенных артефактов от двух платформ, если они не отфильтрованы до конца.

Ложноотрицательные неприватные можно превратить в NOCALL. NOCALL в мотиве целой ветки - вообще ни для кого не проблема, филогенетика восстановит снип. Разве что минорное занижение бывает если снип восстановится уровнем ниже. Далее, NOCALL там где ожидается приват - не ложноотрицательность для байеса, это разве что для Ро проблема. Байес смоделирует сам все что надо - положено за некоторое время выскочить снипу, байес выставит его и засчитает в возраст.

А вот ложноположительные снипы - проблема для любой филогении. Никакой байес их во время подсчета возраста не уберет. Тут только умная фильтрация рулит. Ложных срабатываний в грязных выборках больше чем приватных упущений (приватных ложноотрицательностей). Увеличение порога чтения же лечит обе проблемы, но выплескивается и ребенок - истинные приваты, возраст занижается.

Вывод - только мыть снипы перед употреблением. Хорошо и правильным антисептиком. Особенно, если снипы сразу более чем от одного поставщика - там и более одного вида заразы. Филогенетика может детектировать проблемы привата (кроны дерева) только когда они уже лезут на более чем 1 листик (гомоплазия, но она бывает и истинной) или вообще в ствол (истинной бывает там реже, тк клады на основании слабого снипа не гут). Начальная стадия проблем с кроной обычно не видна (см камент Srkz по сути про это).

« Последнее редактирование: 21 Декабрь 2020, 15:08:05 от Valery »

Оффлайн Valery

  • Сообщений: 7430
  • Страна: 00
  • Рейтинг +860/-6
  • Ultimate Matriarchy
Байес смоделирует сам все что надо - положено за некоторое время выскочить снипу, байес выставит его и засчитает в возраст.

в этом плане, чем хорош байес возраста на фиксированной (уже найденной) топологии - он лечит случай плохого пересечения BEDов двух разноплатформенных выборок. Но при условии что снипы хорошо чищены.

Оффлайн Srkz

  • Сообщений: 6759
  • Страна: ru
  • Рейтинг +3525/-2
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1e-pre T16093C T16311T
Насколько я понимаю, имеется в виду указание на дереве возрастов образцов дДНК, определённых с помошью 14C, или известных из истории (как у Белы III).
Ну поскольку вопрос был сразу после обсуждения расчёта возрастов узлов, я предположил, что речь шла именно о них:
За исключением основной массы древней днк, но по ним мы не считаем возраст. В расчеты добавляются только те древние, у которых кроме покрытия bed'a есть еще и хорошее покрытие в глубину и днк не сильно деградировала. Таких единицы.

Цитировать
В частной теме уважаемого nilogov уже говорилось, что в действительности определяют возраст до ближайшего общего снипа (БОС), а не до генеалогически ближайшего общего предка (БОП), так как не факт, что именно у генеалогичесого БОПа возник данный БОС, а возникнуть этот БОС мог даже за 5 поколений до рождения БОПа.

Наоборот. Попробую ещё раз объяснить. Откройте расчёт TMRCA для какого-нибудь узла на YFull. БОС в формуле не участвует, берётся количество нисходящих снипов. Эти нисходящие снипы возникли строго в период после рождения БОП протестированных, потому что если бы они возникли ранее, то вошли бы в состав общих, то есть стали бы БОС. Следовательно, по этим снипам можно вычислить только ВБОП. Зазор между ВБОП и ВБОС остаётся неопределённым, на результат вычислений возраста внутри ветки он не влияет. Однако, при появлении новых образов ВБОП может приблизиться к ВБОС, в таком случае ожидается его увеличение.

Есть временной зазор между моментом появления самого молодого общего снипа и временем жизни ближайшего общего предка всех протестированных представителей ветви - N поколений. Новых снипов у предков протестированных людей за этот период не возникало. ВБОП (по снипам) = возраст самого молодого общего снипа минус N. При тестировании 6-юродного брата вместо троюродного, если он тоже носитель этого снипа, N уменьшается на три поколения. Поэтому ожидается удревнение ВБОПа. А если не носитель, то мы получаем информацию, что N меньше трёх. По мере охвата ветви тестами, N стремится к нулю. При удаче, может и сразу оказаться нулевым.

Оффлайн Valery

  • Сообщений: 7430
  • Страна: 00
  • Рейтинг +860/-6
  • Ultimate Matriarchy

Наоборот. Попробую ещё раз объяснить. Откройте расчёт TMRCA для какого-нибудь узла на YFull. БОС в формуле не участвует, берётся количество нисходящих снипов. Эти нисходящие снипы возникли строго в период после жизни БОП протестированных, потому что если бы они возникли ранее, то вошли бы в состав общих, то есть стали бы БОС. Следовательно, по этим снипам можно вычислить только ВБОП. Зазор между ВБОП и ВБОС остаётся неопределённым, на результат вычислений возраста внутри ветки он не влияет. Однако, при появлении новых образов ВБОП может приблизиться к ВБОС, в таком случае ожидается его увеличение.

Пусть есть набор засвидетельствованных непосредств. клад-потомков A1,A2,.. и незасвидетелствованных пока еще B1,B2,.. В предположении, что A1,A2,.. имея недавние письменные свидетельства, более родственны, вывод верен. Но они могут на самом деле клады не составлять и на самом деле быть парафилетичны с B1,B2,.. на истинном дереве родства (независимом от снипов). В последнем случае тк выборка A1,A2,..  случайна, она дает несмещенную оценку возраста всего набора родительских снипов. Смещение будет например при недавнем генеалогическом родстве и исчерпывающем охвате некой его ветви тестированием, при неизвестных и заведомо более дальних B1,B2,.. .

Оффлайн Valery

  • Сообщений: 7430
  • Страна: 00
  • Рейтинг +860/-6
  • Ultimate Matriarchy
вопрос очевидно упирается в то как A1,A2,.. соотносится с генеральной совокупостью сниповых клад-потомков, есть ли какие скрытые закономерности выбора известных ветвей.

Для глубоких клад - ну пример. Есть ветка, в ней финны и коми-сысольцы. В чью сторону смещение? ))

Оффлайн Srkz

  • Сообщений: 6759
  • Страна: ru
  • Рейтинг +3525/-2
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1e-pre T16093C T16311T
В последнем случае тк выборка A1,A2,..  случайна, она дает несмещенную оценку возраста всего набора родительских снипов. Смещение будет например при недавнем генеалогическом родстве и исчерпывающем охвате некой его ветви тестированием, при неизвестных и заведомо более дальних B1,B2,.. .
Ну да, я поэтому сформулировал "может приблизиться". Т.е. в ряде случаев приближаться уже не будет.

Оффлайн Valery

  • Сообщений: 7430
  • Страна: 00
  • Рейтинг +860/-6
  • Ultimate Matriarchy
варианты:

1) финны и сысольцы взаимно монофилетичны, и клад обоего типа достаточно много (т.е. базальных ветвей достает для правильного возраста как среднего дочерних клад) - возраст правилен

2) есть неисследованные сысольские базальные клады, длина их исторически первых линков с мутациями окажется иной чем у уже известных клад - возраст изменится

3) топология вообще поменяется если выявится общая дочерняя клада, это может и на возраст повлиять (но это не случай расписки семейной генеалогии, тк там есть истинное бумажное дерево для уже тестированных)

Оффлайн Valery

  • Сообщений: 7430
  • Страна: 00
  • Рейтинг +860/-6
  • Ultimate Matriarchy
Есть ветка, в ней финны и коми-сысольцы. В чью сторону смещение? ))

это на тему paypal и медведя  ;D

Оффлайн Valery

  • Сообщений: 7430
  • Страна: 00
  • Рейтинг +860/-6
  • Ultimate Matriarchy
кстати байес до определенной степени лечит проблему неизвестных B1, B2,... тк моделирует рождения и смерти, при условии что правильно подобрана модель роста популяции.

Оффлайн Oxon

  • Сообщений: 1863
  • Страна: gb
  • Рейтинг +457/-4
А почему нельзя использовать древние образцы (про деградацию ясно), если они датированы другими научными способами?
Для расчёта ВБОПа надо знать количество приватных снипов, а для плохих образцов это число правильно не определить.
Это я поняла.  Смысл в том, что есть реальный, пусть не полный с классификационной точки зрения, образец с достоверной независимой датировкой.  Вроде того гребца галеры, что по дереву (внезапно) годится в родственники-современники Рюрику, а по исторической ситуации не очень.

Оффлайн YaroslavАвтор темы

  • Сообщений: 17469
  • Страна: ru
  • Рейтинг +4133/-13
  • 76% East Europe + 17% Finland
  • Y-ДНК: J1a2b1a ZS3067, ЖМ: I2a1a2b1a1a1a1 FT37540, МЖМ: G2a2b1a1a1a2b2a FT159945
  • мтДНК: K1b1a1 T199C, МЖ: H13a1a1d
Наоборот. Попробую ещё раз объяснить. Откройте расчёт TMRCA для какого-нибудь узла на YFull. БОС в формуле не участвует, берётся количество нисходящих снипов. Эти нисходящие снипы возникли строго в период после рождения БОП протестированных, потому что если бы они возникли ранее, то вошли бы в состав общих, то есть стали бы БОС. Следовательно, по этим снипам можно вычислить только ВБОП. Зазор между ВБОП и ВБОС остаётся неопределённым, на результат вычислений возраста внутри ветки он не влияет. Однако, при появлении новых образов ВБОП может приблизиться к ВБОС, в таком случае ожидается его увеличение.

Спасибо! Вроде как, благодаря Вашим объяснениям, в бестолковке потихоньку что-то начинает проясняться.

Ясно, что подсчёт идёт по снипам, нисходящим от ветви (узла), ВБОП которой мы хотим узнать. Но, сам вычисленный по снипам ВБОП тогда ведь получается интервалом между самым молодым снипом нужной нам ветви и самыми старшими (хронологически первыми появившимися) снипами её дочерних ветвей?
« Последнее редактирование: 22 Декабрь 2020, 22:10:21 от Yaroslav »

Оффлайн YaroslavАвтор темы

  • Сообщений: 17469
  • Страна: ru
  • Рейтинг +4133/-13
  • 76% East Europe + 17% Finland
  • Y-ДНК: J1a2b1a ZS3067, ЖМ: I2a1a2b1a1a1a1 FT37540, МЖМ: G2a2b1a1a1a2b2a FT159945
  • мтДНК: K1b1a1 T199C, МЖ: H13a1a1d
сам вычисленный по снипам ВБОП тогда ведь получается интервалом между самым молодым снипом нужной нам ветви и самыми старшими (хронологически первыми появившимися) снипами её дочерних ветвей?

Нет, фигню какую-то написал.

Всё равно ВБОП - это подсчитанный по снипам промежуток времени, с лихуем охватывающий и ближайший общий снип, и первые хронологически ему последующие снипы, и вообще целый ряд снипов к ним впридачу.

Оффлайн Valery

  • Сообщений: 7430
  • Страна: 00
  • Рейтинг +860/-6
  • Ultimate Matriarchy
Что есть ВБОП, зависит от метода подсчета, обсуждаемый ВБОП - скорее слегка видоизмененный Ро +- сосчитанная по методу Адамова ошибка. Некорректно распространять на иные виды ВБОПов применяемые в этом топике рассуждения. Например, байесовский TMRCA устроен иначе.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.