погрешности оценок TMRCA, которые они делают.
В черновом варианте - какие они, эти погрешности ? Ну, например, генеалоги все занижают TMRCA? Или, напротив, повально завышают?
Есть статистическая погрешность оценки возраста. Очевидно, что точность оценки TMRCA по 10 STR гаплотипам хуже точности расчета по 1000 таких же гаплотипов. Для случая независимых гаплотипов, грубо говоря, в 10 раз. Многие ДНК-генеалоги погрешности своих расчетов рассчитывают именно таким образом, завышая точность (занижая среднеквадратичное отклонение). К сожалению, я приложил к этому руку, опубликовав в 2009 году совместно с А. Клесовым статью об оценке погрешностей. Но гаплотипы не могут быть независимы по всей выборке. Например, у одного отца практически не может быть 1000 сыновей. То есть выборка из 1000 гаплотипов явно не может состоять из независимых образцов, восходящих к одному и тому же ближайшему общему предку. На самом деле, генеалогическое дерево более разветвленное, то есть состоит из нескольких генеалогий, находящихся в разном степени родства друг с другом.
Клесов и сейчас продолжает считать по формуле для независимых событий (Адамов, Клесов, 2009), занижая r.m.s. в своих расчетах, за что его неоднократно критиковали, в том числе и Кен Нордтведт.
Что лучше: десять 100-маркерных гаплотипов или сто 10-маркерных гаплотипов? Для случая независимых гаплотипов разницы нет. В учебном пособии я показываю, что корреляционные связи (зависимость гаплотипов друг от друга) приводят к тому, что возраст лучше оценивать по десяти 100-маркерным гаплотипам, чем по ста 10-маркерным. А погрешности возрастают. Зависят от нескольких факторов: фактического возраста, константы скорости мутаций, особенностей развития генеалогии во времени (темп роста, вероятностное распределение численности сыновей от одного отца и т.д.).