Это пожелание надо обсуждать на нашем форуме. Многие форумчане, особенно ветераны, продолжают использовать термин "ДНК-генеалогия". Раскол сообщества произошел летом 2009 года, но молгеновцы до сих пор не условились о терминах. Клесовцы, понятное дело, тянут одеяло на себя.
Мне кажется, что ваш материал имеет ценность не только в контексте данного форума. А в контексте научной публикации логичнее использовать сложившуюся научную терминологию.
Для учебного пособия я с самого начала решил делать поменьше ссылок, чтобы не перегружать изложение и, соответственно, восприятие читателей.
Ну, это получилось не совсем учебное пособие: очень много самостоятельно полученных результатов, скорее всего, никем ранее не опубликованных.
Ссылки сами по себе, если их оформлять как сноски, совершенно не перегружают основной текст. То есть можно оформить как сноску, или где-то в конце в отдельной заключительной главе дать краткий обзор, кем получены те или иные результаты ранее.
Формулы для вероятностей (9) я вывел самостоятельно в 2009 году.
Это очень круто! Завидую вам белой завистью
По-видимому, при создании третьей версии учебного пособия надо указать, что полученная формула (9) - частный случай из теории случайных блужданий пуассоновского процесса (см. стр.81 в книге Феллер В. (1964) Введение в теорию вероятностей и ее приложения. Том 2).
Подобные случайные блуждания ("распределение пьяного матроса"), насколько я знаю, вслед за Эйнштейном изучал Ноберт Винер, вследствие чего они носят название "
винеровский процесс". Признаюсь, я совершенно не специалист в этой теме, но подозреваю, что термин "пуассоновский процесс" тут не совсем корректен терминологически.
В вашей статье я не увидел явного учета априорной вероятности. Правда, просмотрел её пока очень бегло. Во всяком случае, никаких рассуждений, аналогичных (6) из Walsh, Bruce 2001 я не встретил.
Не готов ответить. До сих пор не понимаю некоторых моментов с использованием параметра Ne для целей молекулярной генеалогии.
У вас в 11-12 главе, пожалуй, косвенно есть этот учёт. По крайней мере, точно есть понимание, что характер ветвления общего древа, известный априорно, влияет на TMRCA. Разве что в 12 главе все выкладки чисто вычислительные по Монте-Карло - нет никакого теоретического обоснования, есть лишь экспериментальное. Правда, есть аналитическая формула (60), но не даётся её вывод, даже в приложениях.
Суровая правда жизни состоит в том, что "коэффициент фертильности" А и "показатель стерильности" p0 в ВПГВГР очень не постоянен во времени, особенно если анализируются периоды в несколько тысяч лет. (Совсем опасно коэффициенты распределения Лотка 1939 года, то есть на XX век, экстраполировать на прошлые века, когда даже среднее количество детей в семье было кардинально иным.) Я полагаю, что сложная зависимость A от времени (влияющую на форму функции априорной вероятности) является причиной парадокса сильного расхождения оценок TMRCA по STR и по SNP. Увы, эта функция не может быть представлена в аналитическом виде, а потому нельзя рассчитывать на то, что чисто аналитические выкладки для оценки TMRCA, даже столь глубоко проработанные, как в вашем учебном пособии, могут удовлетворительно согласовываться с оценками по SNP