Вся сравнительная табличка теперь выглядит так:
Размер выборки ___ Клёсов _____ Темош
10 гаплотипов _____ 4200+/-670 __ 2360-2580
20 гаплотипов _____ 4575+/-600 __ 2760-2990
50 гаплотипов _____ 4400+/-500 __ 2760-2990
Итак, несколько выводов.
1) Добавление даже односубкладных гаплотипов иногда (примем полученный результат за частный случай) сильно изменяет топологию референтной группы.
2) Несмотря на значительное расхождение результатов расчета TMRCA, в способах, используемых Клёсовым и Темошем, прослеживаются сходные характеры изменений времен (иными словами, увеличение интервала для 20 гаплотипов, с последующим снижением для 50).
3) Простым изменением используемых доверительных интервалов можно привести получаемые результаты к подтвержденному (в качестве гипотезы, предположим, что со временем найдутся такие возможности).
4) На генеалогических интервалах способ используемый Темошем (да, и, полагаю, Клёсовым) соответствует архивным данным. Иначе и быть не может, так как они (способы) из этих данных выведены.
5) На дальних дистанциях происходит значительное расползание резульатов, полученных двумя методами.
Давайте просто сверим результаты.
Выводы - одни тривиальные, другие неверные. Третьи типа "ну и что"? То, что я написал выше - (а) гаплотипы - штука упрямая, и (б) даже десяток гаплотипов может дать время общего предка по многомиллионной популяции -
эти выводы и получены.
Но упражнение для новичков полезное, и его стоило было провести. И не нужно лезть на стенку в ответ на замечания. Они были совершеннно справедливы.
Итак, по выводам, чтобы не быть голословным.
1) Добавление даже односубкладных гаплотипов иногда (примем полученный результат за частный случай) сильно изменяет топологию референтной группы.Это вывод банальный и по формулировке неверный. Любой, кто работал с гаплотипами, знает, что на десятке гаплотипов погрешность расчетов велика. Поэтому здесь не "топология" меняется, а просто погрешность в средней величине мутаций на маркер по данной выборке из 10 гаплотипов равна 12.3% (если не округлять). Плюс погрешность в величине самой скорости мутации, вот и 16%-ная ошибка в величине времени до общего предка (при принятых условиях и допущениях).
В серии из 20 гаплотипов первая погрешность уже меньше, 8.4%.
В серии из 50 гаплотипов она 5.4%. Все-таки 342 мутации на серию - это не так мало.
Все полученные величины - в пределах погрешности расчетов. Ни о каком "изменении топологии" здесь речи быть не может. Если, конечно, не вкладывать в это некий смысл, не противоречащий по сути изложенному выше.
2) Несмотря на значительное расхождение результатов расчета TMRCA, в способах, используемых Клёсовым и Темошем, прослеживаются сходные характеры изменений времен (иными словами, увеличение интервала для 20 гаплотипов, с последующим снижением для 50).Вывод по сути неверный. Никакого "увеличения" или "уменьшения" там нет. Все цифры в пределах погрешности расчетов. Вы смотрите на средние величины, но их там по сути нет. Это - облако в пределах указанных погрешностей.
3) Простым изменением используемых доверительных интервалов можно привести получаемые результаты к подтвержденному (в качестве гипотезы, предположим, что со временем найдутся такие возможности).Это я не понял, что к чему привести. Например, археологи найдут, что возраст R1a1 на Русской равнине 7 тысяч лет. Кто к кему "приводить" будем? Просто скажем, что потомки того, ископаемого, не выжили. И никкого "приведения".
4) На генеалогических интервалах способ используемый Темошем (да, и, полагаю, Клёсовым) соответствует архивным данным. Иначе и быть не может, так как они (способы) из этих данных выведены.Не понял, что за "архивные данные". Я вообще, как СПОСОБ может соответствовать "архивным данным".
5) На дальних дистанциях происходит значительное расползание резульатов, полученных двумя методами.Расползание только потому, что я ввел поправку на возвратные мутации (с использованием той самой таблицы), а Вы не вводили. И с этой таблицей ввести ее не можете, поскольку она создана для 25 лет на поколение. Вы можете считать поправку математически, но я не понимаю, зачем это делать, когда уже есть таблица для определенной и откалиброванной скорости мутации, причем откалиброванной для 25 лет на поколение. Поэтому и советовал не изобретать велосипед, а просто взять мои данные по скорости мутации и времени на поколение.
Теперь замечание общего характера. Неправильно то, что DYS391 искусственно лишена мутаций, и выборка не отражает истинного распределения мутаций. Поэтому и время до общего предка занижено. На самом деле оно примерно 4800+/-500 лет. Я понимаю, что это только упражнение, но его стоило бы делать на реальных выборках, а не искаженных.
Продолжаем разбор полетов.
1) Мы все понимаем ( ... ) смысл округления и доверительных интервалов. ...Не знаю, зачем каждый раз дергаться в ответ на справедливые замечания. Повторяю, что писать цифры до 9-го знака, когда достаточно одной-двух, неправильно. Доверительные интервалы Вы не использовали, поэтому насчет понимания смысла не уверен. Когда их посчитаете, тогда увидим, как Вы понимаете из смысл. У меня даны для 95-ных доверительных интервалов.
2) Речь сейчас не идёт об обсуждении методов. Например про таблицы я Вас простым языком спросил "как?" ... ... этой таблицей мы всё ещё пользуемся, ...? Если пользуемся, то как?Я ясно ответил, что я пользуюсь. Потому и мои цифры намного выше. Вам пользоваться ей нельзя. Причины я привел. Вы же хотите непременно иметь скорости и поколения, отличные от моих. Вот и последствия.
3) ... Вашу величину 0.00183 не пересчитываю. ... о ней вообще только сейчас услышал. Эта величина близка к общепринятой. ... Ну если близка, то чего ее не использовать? :-))
Это расчитано по величинам Чандлера (для 12-маркерных гаплотипов) и выверено на серии Мак-Дональдов. Величина для 25-маркерных гаплотипов выверена для той же серии. Откуда Вы взяли 0.0021, причем для 25-маркерных гаплотипов, не имею понятия. Хотелось бы знать источник.
>вернёмся к пункту первому. То Вы ... об абсурдных на Ваш взгляд обилии циферок после запятой, а то вдруг цепляетесь к вопиющей разнице между 0.0021 и 0.0022. Да не на "мой взгляд", а абсурдное обилие цифр после запятой. Разница не вопиющая, а методологическая. Если пересчет - то 0.0022. Если эксперимент (как Вы отметили) то 0.0021. А разницы в отношении расчетов никакой нет, точнее, только 4.5%, что в пределах погрешности расчетов.
4) Последнее. ... в рамках. Поэтому оставьте ... . ... .
Вернёмся к академическому стилю. Угу. Пока, читая Ваши слова и выражения, заметно плохо.
Надеюсь, мои замечания полезны.