Тема: A comment on the paper: Extended Y chromosome haplotypes resolve multiple and un (Прочитано 27359 раз)

Nimissin · « **Ответ #75 :** 29 Октябрь 2009, 14:53:06 »

Цитата: Овод от 28 Октябрь 2009, 17:52:25

Сергей, мы с Вами позже можем в трёхсотый раз обсудить этот вопрос в строгих терминах, но не здесь, а в другой теме. Как Вы знаете, я сам не поклонник "эффективной скорости" ЛЖ, но не потому, что его озабоченность влиянием демографических эффектов на вычисление ВБОП не разделяю, а потому, что в его подходе имеет место "средняя температура по инфекционной больнице" в которой есть и покойники в морге и полно высокотемпературных больных, так что в целом получается 36.7. Нормально, Константин.

Но он прав в том, что поток мутаций, попадая в популяцию (а она рассматривается как относительно изолированный сосуд), частично теряется, "расплёскиваясь" через край (генный дрейф), если сосуд мал или "утекает" через дыры бутылочных горлышек в мёртвые ветви. Никакого дополнительного генного притока в популяцию не предполагается. Если же он налицо, обычно говорят о создании новой популяции с иным генным составом и всё начинают сначала.

Так вот, эти потери, посчитанные в среднем по больнице-Ойкумене за всё время от Адама, вводят нас в заблуждение. Уж лучше их вообще не считать, тем более, что Ойкумена в исторические времена её существования больше напоминает раздувающийся воздушный шар, нежели дырявый и маленький сосуд. И в этом шаре потерь гораздо меньше, чем в первобытном сосуде.

Простите, что прибегнул к аналогиям. Они всегда однобоки. Но могу и в строгих терминах. Только боюсь, Животовскому потребуется адвокат, раз он сам к нам не ходок. Трудно спорить самому с собой. Может Вы, Сергей, возьмётесь?

Полагаю, что ЛЖ неверно толкует правило "одной третьей" Луиджи Кавалли-Сфорца, по которому эффективный размер популяции равен одной третьей от фактического размера. При обосновании т.н. эффективной скорости мутаций ЛЖ полагал, что вклад в дальнейший рост популяции вносит только одна треть от общей численности мужчин. На самом деле Кавалли-Сфорца подразумевал совсем иное, а именно: от общей численности популяции на данный момент времени вклад в следующее поколение вносит только одна треть, так как мальчики (одна треть) и старики (одна треть) вклада не вносят. Для наших же расчетов важно другое: старики уже внесли свой вклад (одно поколение назад), а мальчики еще внесут свой вклад (одно поколение вперед). То есть участвуют все, в первом приближении.

Каржавин · « **Ответ #76 :** 29 Октябрь 2009, 20:51:00 »

Цитата: Nimissin от 29 Октябрь 2009, 14:53:06

Полагаю, что ЛЖ неверно толкует правило "одной третьей" Луиджи Кавалли-Сфорца, по которому эффективный размер популяции равен одной третьей от фактического размера. При обосновании т.н. эффективной скорости мутаций ЛЖ полагал, что вклад в дальнейший рост популяции вносит только одна треть от общей численности мужчин. На самом деле Кавалли-Сфорца подразумевал совсем иное, а именно: от общей численности популяции на данный момент времени вклад в следующее поколение вносит только одна треть, так как мальчики (одна треть) и старики (одна треть) вклада не вносят. Для наших же расчетов важно другое: старики уже внесли свой вклад (одно поколение назад), а мальчики еще внесут свой вклад (одно поколение вперед). То есть участвуют все, в первом приближении.

М-да... Сколько версий! По крайней мере, уважаемый Овод действительно моделировал этот процесс, и я в своих рассуждениях, пожалуй, не учел факт ветвления. То есть, мы имеем не просто выборку независимых случайных величин (аллелей), а действительно некий ветвящийся процесс с точки зрения мутаций, причем даже не совсем цепь Маркова (хотя, надо это обдумать).
Более того, уважаемый Овод прав и в том, что еще раз полностью прояснив эти детали, чего мы добьемся и какую задачу решим? За время с 2005-го года количество ДНК-данных возросло минимум на порядок, (или уже на два порядка?). В это случае мы уже можем позволить себе роскошь рассматривать отдельные рода в популяциях, т.е., провести тонкий анализ популяций. Например, с успехом ДНК-генеалогическим анализом казахских родов занимается уважаемый Asan Kaygy и его товарищи.
По поводу несмещенной максимально правдоподобных оценок матожидания
m = 1/N SUM x(i) (формула 1)
и дисперсии
D = 1/(N-1) SUM (x(i)-m))^2 (формула 2)
то действительно многие забывают про вычитание единицы. Если не вычитать, то мы получим только АССИМПТОТИЧЕСКИ несмещенную оценку. Не далее как неделю назад я с Заказчиком согласовывал одну Методику вычисления неких статистических параметров, так вот он тоже удивился этой вычитаемой единице и заставил меня показать литературу и в Методике сделать ссылку на справочник по математической статистике.
По поводу всего двух измерений уважаемый Овод опять прав. Если мы имеем только ОДНО измерение, то по формуле 1 очевидно, что само измерение является и оценкой матожидания. А если мы по одному измерению x(1) захотим оценить дисперсию, то получим тождественный ноль, поскольку по формуле 1 для N=1 оценка матожидания m=x(1), то есть, равна самому измерению, а оценка дисперсии по формуле 2 (специально будем делить на N, то есть, на единицу) D=(m-(x1))^2 = (x(1)-x(1))^2 = 0. Одним словом, для любого случая получаем тождественный ноль. А если измерений хотя бы два, т.е., x(1),x(2), то дисперсию уже можно вычислять. "Физический" смысл деления на (N-1) примерно таков: в формуле вычисления дисперсии присутствует оценка матожидания, которая уже вычислена по измерениям x(1),x(2),...,x(N)/ Поэтому ма как бы одну степень свободы из N имеющихся уже потратили на вычислении матожидания. Следовательно, количество степеней свобот\ды при вычислении дисперсии на единицу меньше. КОнечно, это некие рассуждения, но формула 2 для несмещенной оценки дисперсии доказывается строго математически.

Овод · « **Ответ #77 :** 29 Октябрь 2009, 22:36:40 »

Цитата: Nimissin от 29 Октябрь 2009, 14:40:10

Уважаемый Овод, на интуитивном уровне полагаю, что Вы правы (я уже не первый
раз об этом говорю). Было бы хорошо, если Вы или кто-то другой смогли оценить влияние.

Правы и Вы, Дмитрий. Одна из причин трёхкратного уменьшения скорости - правило 1/3 Кавалли-Сфорца. Животовский опирается именно на него, и ещё на его же рекуррентное отношение для дисперсии в поколениях. Это во многом объясняет полученный им результат. Но а что вы предложите вместо? Оглянитесь вокруг - у какого процента Ваших друзей есть хотя бы один сын? Я думаю, результат будет не так уж далёк от трети.

Увы, строго рассчитать влияние демографических факторов на эффективный приток мутаций в популяцию мне не по силам. Слишком многоими факторами нужно задаться, тут и размер популяции, и Nэфф, и коэф.роста, её гомогенность, вероятность, глубина и число спазмов в её истории. Ну зададимся, промоделируем - а практический вывод для расчётов где?. Ведь ни для одной реальной популяции ни одного из этих параметров мы толком не знаем. ЛЖ свалил всё в кучу, получил треть и считает, что это лучше чем ничего.

Ну а я так считать не могу. Поэтому и не считаю по ЛЖ.

I2a1a · « **Ответ #78 :** 29 Октябрь 2009, 22:50:01 »

Читаю я дискуссию трех крупнейших специалистов -ДА,СК и ИМ - и получаю истинное удовольствие. Это именно то, чего я ожидал когда-то увидеть на форуме родство.ру. +1 всем участникам. А от себя лично пожелание -может Вам объединить усилия. Игорь мог бы взять на себя моделирования популяционного процесса, ув.Сергей Каржавин и Дмитрий Адамов -инкорпорацию в этот процесс моделирования модели "потока" мутаций и оценку математического ожидания вместе с дисперсией.

I2a1a · « **Ответ #79 :** 29 Октябрь 2009, 22:53:31 »

Да, кстати, и ответ популяционных генетиков должен был бы звучать примерно в духе подобной дискуссии, пусть даже в качестве апологии скоростей Животовского.

Каржавин · « **Ответ #80 :** 30 Октябрь 2009, 13:13:45 »

Цитата: Vadim Verenich от 29 Октябрь 2009, 22:50:01

Игорь мог бы взять на себя моделирования популяционного процесса, ув.Сергей Каржавин и Дмитрий Адамов -инкорпорацию в этот процесс моделирования модели "потока" мутаций и оценку математического ожидания вместе с дисперсией.

Уважаемый Вадим, я всем пытаюсь всучить исходные тексты собственных программ оценки количества мутаций, которые описаны в статье. Никто не берет!

Тексты хорошо откомментированы, алгоритмы для этих программ описаны в статье, т.е., документации не меньше, чем требуется по ГОСТам ЕСПД, а по качеству - лучше, поскольку для себя, любимого, делал. Может, Вы возьмете? А вдруг пригодится?

АвторТема: A comment on the paper: Extended Y chromosome haplotypes resolve multiple and un (Прочитано 27359 раз)

Nimissin

Re: A comment on the paper: Extended Y chromosome haplotypes resolve multiple and un

Каржавин

Re: A comment on the paper: Extended Y chromosome haplotypes resolve multiple and un

Овод

Re: A comment on the paper: Extended Y chromosome haplotypes resolve multiple and un

I2a1a

Re: A comment on the paper: Extended Y chromosome haplotypes resolve multiple an

I2a1a

Re: A comment on the paper: Extended Y chromosome haplotypes resolve multiple an

Каржавин

Re: A comment on the paper: Extended Y chromosome haplotypes resolve multiple an