АвторТема: Определение возраста субклада  (Прочитано 13075 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн FarroukhАвтор темы

  • Maternal Y-DNA: R1b-BY124371
  • Модератор
  • *****
  • Сообщений: 17189
  • Страна: az
  • Рейтинг +5965/-17
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Re: Определение возраста субклада
« Ответ #15 : 11 Февраль 2010, 19:22:45 »
Цитировать
Первых метод никуда не годится.
Кстати сказать, но именно это и делает Клёсов. Если какая-нибудь относительно молодая ветвь (иначе говоря - кластер) будет преобладать в выборке по численности, она «подомнёт» остальные, более старые, и будет «диктовать» свой базовый гаплотип и тянуть одеяло на себя.

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Определение возраста субклада
« Ответ #16 : 11 Февраль 2010, 19:43:39 »
Да, но причем здесь модал? Если проявляются две (или более) ветви - нужно считать возраст каждой раздельно. Это Клёсов и имеет в виду. Но заменять одну из них модалом, чтобы считать возраст остальных - глупо. Во первых - причём здесь "остальные"? Во-вторых - зачем добавлять к ним модал первой? Модал ведь - даже не один из её членов (чтобы снизить их влияние), а условно-предковый для неё.
 
Так зачем же смешивать современников и предков "в одном флаконе" ?

Оффлайн FarroukhАвтор темы

  • Maternal Y-DNA: R1b-BY124371
  • Модератор
  • *****
  • Сообщений: 17189
  • Страна: az
  • Рейтинг +5965/-17
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Re: Определение возраста субклада
« Ответ #17 : 11 Февраль 2010, 20:30:31 »
Цитировать
Если проявляются две (или более) ветви - нужно считать возраст каждой раздельно. Это Клёсов и имеет в виду. Но заменять одну из них модалом, чтобы считать возраст остальных - глупо.
То есть, как я понял, при расчёте общего предка пяти ветвей лучше взять 5 модалов и посчитать. Именно это я и хотел уточнить. 

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Определение возраста субклада
« Ответ #18 : 11 Февраль 2010, 20:58:05 »
То есть, как я понял, при расчёте общего предка пяти ветвей лучше взять 5 модалов и посчитать. Именно это я и хотел уточнить.

Низзя. Не в коем случае не брать модалы - о чём я и толкую. Модалы уже будут иметь меньший возраст, чем современники. Как считать по кросс-дисперсии - уже объяснял.
 
Не знаю, как считал Клёсов. Но если заменял кого-то модалами - не верьте ему. Низзя этого делать.

Оффлайн mouglley

  • ...
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Re: Определение возраста субклада
« Ответ #19 : 11 Февраль 2010, 21:26:44 »
Согласен.
И так расчёт по живым гаплотипам даёт огромную погрешность.
Внесение в расчёт ещё и модалов грозит не просто неверностью результатов, но смещением всего дерева, всех дат в направлении, угодном тому, кто считает.

Забудьте результаты, подсчитанные с использованием модалов, как о страшном сне.
Лучше пересчитать заново.

Оффлайн VVR

  • ...
  • Сообщений: 2456
  • Страна: ua
  • Рейтинг +618/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Re: Определение возраста субклада
« Ответ #20 : 12 Февраль 2010, 00:06:07 »
Клёсов не совсем так считает. Он рассчитывает возраст ветвей. Потом разницу между модалами пересчитывает в возраст, как по двум(или по кол-ву ветвей) гаплотипам, принимая модалы, как предковые ветвей. Потом по формуле общий возраст. В обсуждении на родстве я объяснял, почему такой рассчёт с разбиением по ветвям явно увеличивает погрешность рассчёта, как правило в сторону уменьшения, но также отмечал, что линейный метод без разбиения на ветви(если есть явно разные ветви) ещё хуже, т.к. даёт что-то  среднепотолочное. В основном с моими аргументами АК согласился.

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Определение возраста субклада
« Ответ #21 : 12 Февраль 2010, 00:35:04 »
Вопрос только - зачем так долго мучиться, если проще (и гораздо точнее) сделать кросс-оценки между ветвями хоть по линейной модели (как у Клависа), хоть по квадратичной (как у меня). Но ни в коем случае, не по всей выборке вместе.
 
Но зачем модалами-то заменять? А то, что чохом всё вместе считать плохо - то это и Клёсов понимает. И неоднократно и справедливо на это указывал.

Оффлайн VVR

  • ...
  • Сообщений: 2456
  • Страна: ua
  • Рейтинг +618/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Re: Определение возраста субклада
« Ответ #22 : 12 Февраль 2010, 00:56:10 »
Про гораздо точнее не совсем понятно. Разве есть чем проверить?
А вот что делать с подсчётом возраста дерева, где 10 веток и 20 отдельных гаплотипов, ещё и 67-м?

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Определение возраста субклада
« Ответ #23 : 12 Февраль 2010, 01:17:13 »
Про гораздо точнее не совсем понятно. Разве есть чем проверить?
А вот что делать с подсчётом возраста дерева, где 10 веток и 20 отдельных гаплотипов, ещё и 67-м?

Проверить можно головой. Поскольку все три методы основаны на одной модели (одношаговых, равновероятных по направлению мутаций, возникающих при мейозе) то совершенно очевидно, что оба кросс-метода ей полностью соответствуют, в то время как замена модалами - нет. Она даст просто чуть меньшую ошибку, чем расчёт "чохом". То есть - опять же занизит время предка, хоть и не столь значительно.
 
Другой метод, ещё более продвинутый (ро-статистика) будет давать лучшие оценки даже при выходе за границы этой модели. И ещё - учитывать популяционные эффекты (типа Животовского), но предметно, по ветвям, а не "усреднением по больнице".
 
Последний Ваш вопрос не понял. Если у Вас дерево из 20 гаплотипов состоит из 10 ветвей (по паре на каждую) - его просто надо выкинуть. Или вырастить хотя бы до десятка гаплотипов на ветке. Какие тут могут быть кросс-оценки? В первом приближении, это просто - "звёздный кластер". Считайте общего предка самым обычным методом, за неимение лучшего. Кросс по ветвям даст ту же оценку. А об установлении времени расхождения ветвей можно будет думать, когда оно "подрастёт".

Оффлайн FarroukhАвтор темы

  • Maternal Y-DNA: R1b-BY124371
  • Модератор
  • *****
  • Сообщений: 17189
  • Страна: az
  • Рейтинг +5965/-17
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Re: Определение возраста субклада
« Ответ #24 : 12 Февраль 2010, 06:26:04 »
Столько умных мыслей мелькает по форуму, но все они со временем так и остаются погребёнными.

Мужики, как насчёт превратить содержимое этой беседы в статью с кратким и доступным простым людям руководством по определению возрастов деревьев?

Оффлайн Clavis

  • Семенов Михаил Юрьевич
  • Сообщений: 1495
  • Страна: ru
  • Рейтинг +111/-0
    • https://m.vk.com/@clavis1953
  • Y-ДНК: G2a2 L1264
  • мтДНК: HV9, ранее известная как HV3a
Re: Определение возраста субклада
« Ответ #25 : 12 Февраль 2010, 07:13:11 »
Про гораздо точнее не совсем понятно. Разве есть чем проверить?
А вот что делать с подсчётом возраста дерева, где 10 веток и 20 отдельных гаплотипов, ещё и 67-м?
Это же прекрасно, что 67-м! чем больше информации сидит в одном гаплотипе, тем лучше. А урезать ее до 37-м или 25-м никогда не поздно. Я уже занимался этим в теме R1(a,b), и получил, что скорости Клесова для 25, 37 и 67 маркеров противоречат друг другу. Но я сейчас не о том.
Что я буду делать с 20 гаплотипами? Создам табличку 20х20 клеток и помещу в нее ВСЕ расстояния между ВСЕМИ гаплотипами, в виде суммы одношаговых мутаций. Быстромутирующие и медленномутирующие маркеры нет смысла разделять: если у пары гаплотипов старый общий предок, то и быстрых и медленных мутаций у этой пары пропорционально больше, чем у молодой пары.
Ищем самые большие числа: они нам покажут, где началось первое ветвление.
Допустим, это первое ветвление разбило нашу выборку на две ранних ветви, в одной три гаплотипа, а в другой 17. Мы имеем 3*17 = 51 (пятьдесят одну) разную цепочку от современника к современнику через одного и того же предка: самого молодого общего предка всех 20 представителей древа. Его возраст и есть возраст дерева, потому что неразветвленный ствол нас интересовать не может.
Длина каждой цепочки в годах одинакова: это удвоенное TMRCA. А вот мутаций на этом пути будет разное количество. В одном клане традиции поздних браков, в другом - ранних. Это уже разное число звеньев отец-сын. Да и при одинаковом числе звеньев число мутаций будет разное: стихия, понимаете, анархия.
Но 51 различный результат позволят нам посчитать TMRCA во-первых, более точно, чем один-два расчета, во-вторых, позволят по разбросу оценить доверительный интервал. Надо только использовать правильную зависимость числа мутаций от времени (их есть у меня), а в нее подставить правильную скорость мутаций (а вот тут имеется напряженка: скорость Клесова для 67 показывает сплошь и рядом омоложение предка, чего не скажешь о скоростях для 12 и 25, значит, надо откалибровать первую по второй).
За дело?
« Последнее редактирование: 12 Февраль 2010, 08:07:32 от Clavis »

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Определение возраста субклада
« Ответ #26 : 12 Февраль 2010, 14:43:22 »
Клавис, опять Вы увлекаетесь. Будучи правы в одном (преимуществе кросс-оценок), Вы забываете об обратной стороне медали: Если считать по максимуму возраста всех пар гаплотипов, Вы низведёте статистику до одной, наиболее "старой" пары в выборке. И имеете, таким образом, в отсутствие стат.смещения, огромный стат.разброс, который намного это смещение традиционного метода перекрывает.
 
Это давняя философская дилемма, присутствующая во всех измерениях, вплоть до квантовой механики: улучшая один параметр оценки, Вы "размазываете" другой.
 
Так что не надо забывать о репрезентативности. Кросс-методы хороши только тогда, когда есть достаточное количество гаплотипов в обоих ветвях, предка которых нужно вычислить.

Оффлайн Clavis

  • Семенов Михаил Юрьевич
  • Сообщений: 1495
  • Страна: ru
  • Рейтинг +111/-0
    • https://m.vk.com/@clavis1953
  • Y-ДНК: G2a2 L1264
  • мтДНК: HV9, ранее известная как HV3a
Re: Определение возраста субклада
« Ответ #27 : 13 Февраль 2010, 03:55:30 »
Так что не надо забывать о репрезентативности. Кросс-методы хороши только тогда, когда есть достаточное количество гаплотипов в обоих ветвях, предка которых нужно вычислить.
Согласен, и добавлю, что очень часто самый ранний общий предок делит крону дерева в соотношении 1:100. Какое уж тут количество!
Но, может быть, возраст такого предка и не очень актуален для остальных 100 участников мероприятия?
Хотя есть и противоположные случаи. Последнее опубликованное на нашем форуме древо N делится самым ранним предком примерно пополам. Вот идеальный случай для кросс-метода.
« Последнее редактирование: 13 Февраль 2010, 04:04:20 от Clavis »

Оффлайн VVR

  • ...
  • Сообщений: 2456
  • Страна: ua
  • Рейтинг +618/-0
  • Y-ДНК: o.R1a1a1b1a2a1a1a1e~-YP569,YP1260+;м.R1a1a1b1a1a1a2~-L260,YP1337+
  • мтДНК: K1c1h
Re: Определение возраста субклада
« Ответ #28 : 13 Февраль 2010, 14:14:55 »
Проверить можно головой. Поскольку все три методы основаны на одной модели (одношаговых, равновероятных по направлению мутаций, возникающих при мейозе) то совершенно очевидно, что оба кросс-метода ей полностью соответствуют, в то время как замена модалами - нет. Она даст просто чуть меньшую ошибку, чем расчёт "чохом". То есть - опять же занизит время предка, хоть и не столь значительно.
Головой это конечно хорошо. И это обязательное условие, но всё таки недостаточное (в данном случае). Хотелось бы что-то более показательное. Замена модалами в том виде, который я описал(если внимательно прочитали), также соответствует этой модели.
Что занижает возраст понятно, я даже объяснял причины занижения. Непонятно, как кросс-метод компенсирует эти проблемы.

Другой метод, ещё более продвинутый (ро-статистика) будет давать лучшие оценки даже при выходе за границы этой модели. И ещё - учитывать популяционные эффекты (типа Животовского), но предметно, по ветвям, а не "усреднением по больнице".
С ро-статистикой, к сожалению, пока не знаком, поэтому что-либо утверждать не могу.

Последний Ваш вопрос не понял. Если у Вас дерево из 20 гаплотипов состоит из 10 ветвей (по паре на каждую) - его просто надо выкинуть. Или вырастить хотя бы до десятка гаплотипов на ветке. Какие тут могут быть кросс-оценки? В первом приближении, это просто - "звёздный кластер". Считайте общего предка самым обычным методом, за неимение лучшего. Кросс по ветвям даст ту же оценку. А об установлении времени расхождения ветвей можно будет думать, когда оно "подрастёт".
Моя вина. Невнятно сформулировал. Так как Вы поняли мой вопрос - это достаточно просто. Такой вопрос я бы не задавал. Я имел ввиду большое 67-м(конечно, чем больше маркеров, тем лучше, хотя Clavis возможно прав - тут могут вылазить проблемы калибровки)  дерево, например гаплотипов 120-150, на дереве 10 ветвей различного возраста по 10-15 гаплотипов каждая плюс 15-20 отдельных, не примыкающих к ветвям, гаплотипов. Я так думаю, любым методом будут серьёзные сложности.

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Определение возраста субклада
« Ответ #29 : 13 Февраль 2010, 21:11:08 »
Эх, VVR, VVR ... я то надеялся, что Вы слёту примете моё приглашение "поработать головой", чтобы разобраться с этой несложной задачке. Неужели в Ракетно-Артиллеристких Училищах так плохо преподавали математику?
 
Ещё раз поясню, почему для выявления времени предка двух сестринских кладов нельзя использовать никакие модалы и вообще - никаких промежуточных "фантомов", даже - модала самого искомого предка.
 
Привлекая модалы, Вы разбиваете вычисление возраста на этапы - от листиков одной группы до её модала, затем - между двумя модалами (если не делаете дополнительной ошибки, включая в расчёт еще и общий модал ветвей), и, наконец, от второго модала - до его листов. Затем суммируете, делите на два и получаете время общего предка.
 
Разумеется, на каждом этапе вы вычисляете не только "видимые" мутации, но и предсказываете количество возвратных (тем или иным способом), делая расчет возраста с их учётом. Вот тут то и кроется Ваша ошибка:
 
Вы наивно полагаете, что сумма этих поправок будет равна средней поправке, взятой между терминальными листиками (посколько суммы времен совпадают). Отнюдь. Функция, связывающая наблюдаемыемое и "предсказанное" число мутаций нелинейна, более того - экспоненциальна. Поправки (и вообще все вычисления) по сумме времён не будут равны сумме поправок. На малых сроках сумма учитываемых возвратных мутаций между модалами будет крохотной, а на деле, между терминальными листами (на сумме этих сроков) - весьма солидной. Отсюда и Ваша недооценка возраста. Теперь - понятно?
 
На всякий случай приведу "артиллеристкую" аналогию. Отводя орудие с расстояния прямой наводки на более длинную дистанцию, вы должны изменить не только угол наводки по прямой на цель , но и трубку, учитывая рассчётную траекторию снаряда заново. Причём изменения эти при двойном перемещении не будут равны двукратному изменению при одинарном откате. Потому, как и в нашем случае, эффект здесь - нелинеен.
 
 
« Последнее редактирование: 13 Февраль 2010, 21:19:27 от Овод »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.