В результате объяснения вернулись снова к правильным терминам
Есть подозрение, что развернувшаяся дискуссия по терминам - для данной темы офтоп.
Но не могу не вставить пять копеек. Из Вики: Пуассо́на пото́к (проце́сс), (устар. Пуассоновский процесс[1]) — поток однородных событий, для которого число событий в интервале А не зависит от чисел событий в любых интервалах, не пересекающихся с А, и имеет Пуассона распределение с параметром Λ(А). В теории случайных процессов описывает количество наступивших случайных событий, происходящих с постоянной интенсивностью.
То есть, про "частоту событий" не упомянуто. Фигурирует понятие "интенсивности наступления событий"
Что до англотерминов, замечу, что понятию "мутирование" в английском языке нет соответствия. Слово mutation заменяет все нюансы.
Про интенсивность я еще на Родстве пытался заикнуться, но меня коллективно не поняли, и я понимаю почему: только статистики среди себя понимают, что означает "интенсивность". А вот понятие "частота" наиболее близко по смыслу к "интенсивности", но только в нашем конкретном случае. И вот почему.
Вообще говоря, у нас НЕТ НИКАКОГО ПУАССОВСКОГО ПОТОКА мутаций, а есть ПОТОК БЕРНУЛЛИ.
Схема Бернулли состоит в следующем: производится последовательность испытаний (для нас - последовательность поколений), в каждом из которых вероятность наступления определенного события А (мутация) одна и та же и равна р. Испытания предполагаются независимыми (т.е. считается, что вероятность появления события А в каждом из испытаний (поколений) не зависит от того, появилось или не появилось это событие в других испытаниях-поколениях). Наступление события А обычно называют успехом, а ненаступление - неудачей. Обозначим вероятность неудачи q=1-P(A)=(1-p). Вероятность того, что в n независимых испытаниях-поколениях успех (мутация) наступит ровно m раз, выражается формулой Бернулли:
Pn(m) = C(n,m)*(p^m)*(q^(n-m))
здесь
p^m означает p в степени m.
(q^(n-m)) означает q в степени (n-m)
C(n,m) - число сочетаний из n по m.
Поскольку у нас время ДИСКРЕТНО (1-е поколение, 2-е поколение и т.д.), то надо рассматривать ВЕРОЯТНОСТЬ того, что в каждом поколении произойдет факт мутирования. Никакой интенсивности и скорости мутаций вообще здесь нет. А вот вероятность мутирования - это фактически и есть частота осуществления мутаций (вспомним, что под вероятностью иногда понимают предел, к которому стремится "частота" наступления события при неограниченном увеличении количества испытаний).
Поток Пуассона - это асимптотическое приближение потока Бернулли, а распределение Пуассона - соответственно является асимптотикой биномиального распределения. При этом "интенсивность" пуассоновского потока Lambda = n*p (конечно, при условии очень большого интервала времени "n" и малой вероятности "p", то есть в случае очень редкого потока).
Таким образом, у нас чисто поток Бернулли, пусть и с переменной во времени вероятностью мутирования (и ее оценкой - частотой мутирования).
То есть, частота события (мутации) есть просто оценка вероятности "p" осуществления события (мутации) в потоке Бернулли.
Все аналитические соотношения, которые мы с Д.Адамовым получали ранее для оценки количества мутаций и прочего классическим ASD методом или методом выборочных пар, в общем то, справедливы и для описания потока мутаций потоком Бернулли.
Когда исследуют пары "отец-сын", в соответствии с вышеизложенным берут количество испытаний и определяют, сколько было удачных событий (мутаций), а затем из этих двух чисел получают ЧАСТОТУ наступления события (мутации). Эта частота как раз и есть ОЦЕНКА вероятности "p" наступления события (мутации). Вся терминология четко взаимосвязана.
Ежу понятно, что вероятность "p" это не совсем интенсивность потока "Lambda". Но как быть? Значительная часть форумного сообщества активно отвергает и понятие частоты событий-мутаций и понятие интенсивности потока событий-мутаций. Все-таки, измеряем мы на практике (по парам "отец-сын") именно частоту событий. Заметим, что и физическая размерность этой экспериментально полученной величины [количество мутаций/поколение] полностью соответствует понятию частоты события.
В общем, проблема терминологии на форуме существует. Я думаю, что коли мы используем определенный математический аппарат, то чтобы в дальнейшем не было терминологической путаницы, использовать не те наименования, к которым "привыкли", а те, которые корректны. И при этом странные для русскоязычного специалиста апелляции к тому, что вот это понятие в англоязычной литературе трактуется как "скорость мутаций" вместо "частота мутаций", вообще не должны рассматриваться. В российской математической литературе терминология уже более ста лет устоялась. И лучше при переводе англоязычной литературы применять правильные русские термины, а не пытаться выдумывать какой-то новый математико-генеалогический жаргон.