Полагаю, что ЛЖ неверно толкует правило "одной третьей" Луиджи Кавалли-Сфорца, по которому эффективный размер популяции равен одной третьей от фактического размера. При обосновании т.н. эффективной скорости мутаций ЛЖ полагал, что вклад в дальнейший рост популяции вносит только одна треть от общей численности мужчин. На самом деле Кавалли-Сфорца подразумевал совсем иное, а именно: от общей численности популяции на данный момент времени вклад в следующее поколение вносит только одна треть, так как мальчики (одна треть) и старики (одна треть) вклада не вносят. Для наших же расчетов важно другое: старики уже внесли свой вклад (одно поколение назад), а мальчики еще внесут свой вклад (одно поколение вперед). То есть участвуют все, в первом приближении.
М-да... Сколько версий! По крайней мере, уважаемый Овод действительно моделировал этот процесс, и я в своих рассуждениях, пожалуй, не учел факт ветвления. То есть, мы имеем не просто выборку независимых случайных величин (аллелей), а действительно некий ветвящийся процесс с точки зрения мутаций, причем даже не совсем цепь Маркова (хотя, надо это обдумать).
Более того, уважаемый Овод прав и в том, что еще раз полностью прояснив эти детали, чего мы добьемся и какую задачу решим? За время с 2005-го года количество ДНК-данных возросло минимум на порядок, (или уже на два порядка?). В это случае мы уже можем позволить себе роскошь рассматривать отдельные рода в популяциях, т.е., провести тонкий анализ популяций. Например, с успехом ДНК-генеалогическим анализом казахских родов занимается уважаемый Asan Kaygy и его товарищи.
По поводу несмещенной максимально правдоподобных оценок матожидания
m = 1/N SUM x(i) (формула 1)
и дисперсии
D = 1/(N-1) SUM (x(i)-m))^2 (формула 2)
то действительно многие забывают про вычитание единицы. Если не вычитать, то мы получим только АССИМПТОТИЧЕСКИ несмещенную оценку. Не далее как неделю назад я с Заказчиком согласовывал одну Методику вычисления неких статистических параметров, так вот он тоже удивился этой вычитаемой единице и заставил меня показать литературу и в Методике сделать ссылку на справочник по математической статистике.
По поводу всего двух измерений уважаемый Овод опять прав. Если мы имеем только ОДНО измерение, то по формуле 1 очевидно, что само измерение является и оценкой матожидания. А если мы по одному измерению x(1) захотим оценить дисперсию, то получим тождественный ноль, поскольку по формуле 1 для N=1 оценка матожидания m=x(1), то есть, равна самому измерению, а оценка дисперсии по формуле 2 (специально будем делить на N, то есть, на единицу) D=(m-(x1))^2 = (x(1)-x(1))^2 = 0. Одним словом, для любого случая получаем тождественный ноль. А если измерений хотя бы два, т.е., x(1),x(2), то дисперсию уже можно вычислять. "Физический" смысл деления на (N-1) примерно таков: в формуле вычисления дисперсии присутствует оценка матожидания, которая уже вычислена по измерениям x(1),x(2),...,x(N)/ Поэтому ма как бы одну степень свободы из N имеющихся уже потратили на вычислении матожидания. Следовательно, количество степеней свобот\ды при вычислении дисперсии на единицу меньше. КОнечно, это некие рассуждения, но формула 2 для несмещенной оценки дисперсии доказывается строго математически.