Тема: Выборки гаплотипов - теория и практика (Прочитано 30875 раз)

Valery

АК: честно, а вам никогда не хотелось знать как устроены ветви, каковы предковые гаплотипы? Вы действительно оцениваете эволюцию только по одной характеристике - по возрасту предков? Мне кажется что "днк-генеалогия" если ее ограничивать только возрастами будет крайне убогой.

aklyosov

Цитата: Valery от 13 Сентябрь 2009, 02:57:25

Цитировать
А суть в том, что здесь ветвей как таковых нет. Это не ветви, а просто временные образования, не отражающие сути выборки. Это как бросать монету, и каждый раз строить "ветви" выпаданий, и ломать над ними голову, причитая, что это все не имеет смысла. А оно и в самом деле не имеет.

Так в том и дело: на микросателлитах филогении нет. Я неоднократно пытался Вам это доказать. Теперь похоже Вы это понимаете. Но помимо микросателлит есть огромная масса вещей где есть куда больший порядок чем

Цитировать
Есть один параметр - среднее число мутаций на маркер (или на гаплотип).

И вот там всякие мурки-жмурки рулят.

Понимаете, Valery, я Вам сейчас "одын умный вещь скажу". Ваша методология для науки не подходит. Вот Вы пишете всякие диффузные вещи, уклончивые пассажи, и прочеее. Ответа не даете. Вы создаете некий шум.

Наука так не работает. Там надо давать определенный ответ, понимая, что лучше рабочая гипотеза, чем ничего. Рабочая гипотеза - это то, что можно править, принимая ее за основу. Эту уже шаг вперед. От этого можно уже отталкиваться. Это можно опровергать, но НА ОСНОВЕ другой, альтернативной гитотезы. От нее тоже можно отталкиваться.

Вы так не умеете. Не можете. Я понимаю, не дано. Но голое критиканство - не база для работы.

Короче, как первое приближение - среднее число мутаций на гаплотип является определяющим. Это дает вычисление до общего предка. Потом можно принимать во внимание асимметрию мутаций, и прочие юстировки, но это погоды не изменит. Поправки на возвратные мутации я уже ввел.

Понимаете, Valery, будь Вы рациональней, Вы бы поняли, что научные звания, степени и прочие титулы просто так не дают. Сорок лет в науке тоже не хухры-мухры. Вам бы стоило подумать - а ведь, черт возьми, у него ведь есть опыт научного мышления, стоит прислушаться. Но, к сожалению, идея о кухарке, управляющей государством, глубоко запала в Вашу ментальность.

Вот в США этого нет. В России, к сожалению, есть. В США опыт глубоко уважают. В России - нет. Там каждый сопляк мыслит, что ему любой профессионал по плечу.

Big mistake.

Короче, расчеты я дал. Это - лучшее, что кто-либо может иметь.

aklyosov

Цитата: Valery от 13 Сентябрь 2009, 03:10:19

АК: честно, а вам никогда не хотелось знать как устроены ветви, каковы предковые гаплотипы? Вы действительно оцениваете эволюцию только по одной характеристике - по возрасту предков? Мне кажется что "днк-генеалогия" если ее ограничивать только возрастами будет крайне убогой.

А откуда вы это взяли? Предковые гаплотипы - мой главнй интерес. Более того, я сейчас плотно работаю с палеонтологами, антропологами, археологами, лингвистами. У меня вполне широкий взгляд на синтез этих дисцциплин. Возрасть предков - только одно малое звено в этой картине.

Откуда вы это все берете?

Valery

Цитата: aklyosov от 13 Сентябрь 2009, 03:22:44

Цитата: Valery от 13 Сентябрь 2009, 03:10:19
АК: честно, а вам никогда не хотелось знать как устроены ветви, каковы предковые гаплотипы? Вы действительно оцениваете эволюцию только по одной характеристике - по возрасту предков? Мне кажется что "днк-генеалогия" если ее ограничивать только возрастами будет крайне убогой.

А откуда вы это взяли? Предковые гаплотипы - мой главнй интерес.

Поздравляю - Вы как и большинство присутствующих на данном форуме интересуетесь предковыми гаплотипами!

И как вы собираетесь их считать? Вы действительно думаете, что 40 построннего лет опыта дают вам знание большее чем есть у тех кто 40 лет этими предковыми типами занимался, и только ими? Чудеса. Фельзенштейн не умеет считать предков на микросателлитах а Вы умеете. Давайте серьезно. Вы не интересовались этой отраслью ранее. Хорошо лет 5. От силы. И чем вы эти 5 лет занимались? Вы удосужились хоть раз книжку открыть почитать теоремы? Нет. Знаю, что нет. Более того - Вы гордились этим. Дикое самомнение. А замахнулись на серьезнейшие вещи. В такой ситуации можно ожидать что вы скажем будете переписываться с Фаррисом или Семплом обсуждая какую-нибудь новую модель эволюции микросателлит, или с Животовским на тему возвратных мутаций. Ан нет: вы с "с палеонтологами, антропологами, археологами, лингвистами" решаете совершенно фундаментальные вопросы биологической эволюции.

Ну хоть постеснялись бы давать советы. Для начала.

Сделаю еще одну попытку направить дискуссию в конструктивное русло. Можно ли попросить Вас сбавить менторский тон по крайней мере до момента, пока Ваши бесспорные заслуги не признает биологическое сообщество? Я допускаю, что это случится. Как и многие другие абстрактные возможности - например, что на свете есть ад и там живут черти итд.

aklyosov

Опять ля-ля, как обычно.

Никакой конструктивности. Бесполезно.

Я, дорогой Valery, занимаюсь скоростями десятки лет. Вы же опять по верхам.

Я считаю ниже своего достоинства препираться с Вами на тему своего вклада - потенциального и текущего - в новую область науки. Оставайтесь при своем мнении.

P.S. Valery, откуда такое страстное желание поставить меня "на свое место"? Ну что вас так колбасит?

P.P.S. Я предложил вам перейти на академический стиль в дискуссии. Если вам это выражение непонятно - то говорить о деле и по-деловому. Но похоже, этот стиль вам неведом. Неудивительно.

Mich Glitch

Цитата: aklyosov от 13 Сентябрь 2009, 02:39:46

Это все рассчитано с совершенно обоснованной и калиброванной скоростью мутации 0.00183 на маркер на поколение в 25 лет для 25-маркерных гаплотипов. Откуда эти 0.0021?? Откуда 30 лет?? Какие к этому основания??

Все давно уже разработано и проверено сотни раз. Зачем изобретать велосипед?

Анатолий,
Коснусь пока только этого вопроса.
Первое, это я Вам должен порекомендовать не изобретать велосипед. Это не очередная колкость, ниже объясню почему. Просто я других людей теперь считаю более авторитетными.
Второе, я использую общепризнанные (выделяю!), экспериментально полученные (выделяю дважды!!) скорости мутаций и поколенного интервала.
Третье, немножечко арифметики:
0.00183 / 25 * 30 = 0.002196 ? 0.0021 (надеюсь, понятно?)

Практический вопрос. Вот этими табличками:

как пользоваться?
Или ими нельзя пользоваться самими по себе?
Или это отброшенный промежуточный этап Ваших рассуждений?

Mich Glitch

Шагаем дальше.
20 гаплотипов (см. приложенную таблицу).
Имеем медианную генетическую дистанцию 8.
А вот средняя дистанция равна 7.426315789. Округляя до целого, 7.
Иными словами, добавление новых 10 гаплотипов - перекосило выборку.
Имеем TMRCA: 2760-2990 до общего предка.

Промежуточный итог:

Размер выборки ___ Клёсов _____ Темош
10 гаплотипов _____ 4200+/-670 __ 2360-2580
20 гаплотипов _____ 4575+/-600 __ 2760-2990

aklyosov

Цитата: Mich Glitch от 13 Сентябрь 2009, 07:13:54

Цитата: aklyosov от 13 Сентябрь 2009, 02:39:46
Это все рассчитано с совершенно обоснованной и калиброванной скоростью мутации 0.00183 на маркер на поколение в 25 лет для 25-маркерных гаплотипов. Откуда эти 0.0021?? Откуда 30 лет?? Какие к этому основания??

Все давно уже разработано и проверено сотни раз. Зачем изобретать велосипед?

Коснусь пока только этого вопроса.
Первое, это я Вам должен порекомендовать не изобретать велосипед. Это не очередная колкость, ниже объясню почему. Просто я других людей теперь считаю более авторитетными.
Второе, я использую общепризнанные (выделяю!), экспериментально полученные (выделяю дважды!!) скорости мутаций и поколенного интервала.
Третье, немножечко арифметики:
0.00183 / 25 * 30 = 0.002196 ? 0.0021 (надеюсь, понятно?)

Практический вопрос. Вот этими табличками:

как пользоваться?
Или ими нельзя пользоваться самими по себе?
Или это отброшенный промежуточный этап Ваших рассуждений?

1. Вы можете выделять хоть пять раз, но поясните, пожалуйста, понятие "экспериментально полученные скорости мутаций", как и "экспериментально полученные" величины "поколенного интервала". Кем получены величины 0.0021 и с какой воспроизводимостью?

2. Если Вы просто пересчитываете из моей величины 0.00183 отношением 25 к 30, то получаете 0.0022, а не 0.0021. Вы почему-то берете 0.0021. Видимо, в этом есть какой-то смысл.

3. Вы можете брать хоть какую скорость мутации, дело Ваше. Можете и улицу на красный свет переходить, и стоять под стрелой, и влезать. Дело опять же Ваше. Я хотел помочь, но раз Вы хотите использовать свои цифры, то сходимости у нас не будет. Дело Ваше, мне опять же все равно.

4. Я эти таблицы постоянно использую, но с Вашей скоростью 0.0021 и 30-. годами на поколение они для Вас непригодны. Я именно то и имел в виду под "изобретением велосипеда". Вы меняете вроде бы мелочь, но сыпется и все остальное. Дело опять же Ваше.

5. Советую обратиться "к более авторитетным людям" с этими вопросами. Куда уж мне на них ответить...

aklyosov

Цитата: Mich Glitch от 13 Сентябрь 2009, 07:45:00

Шагаем дальше.
20 гаплотипов (см. приложенную таблицу).
Имеем медианную генетическую дистанцию 8.
А вот средняя дистанция равна 7.426315789. Округляя до целого, 7.
Иными словами, добавление новых 10 гаплотипов - перекосило выборку.
Имеем TMRCA: 2760-2990 до общего предка.

Промежуточный итог:

Размер выборки ___ Клёсов _____ Темош
10 гаплотипов _____ 4200+/-670 __ 2360-2580
20 гаплотипов _____ 4575+/-600 __ 2760-2990

У Вас несколько принципиальных методических и смысловых проколов.

Во-первых, приводить данные до девятого знака после запятой для таких систем - это безумие. Я понимаю, Вы в итоге округлили, но даже писать как промежуточный вариант 9 знаков после запятой - это нечто.

Во-вторых, ничего не перекосило. Имеет место нормальная погрешность среднего числа мутаций на маркер. Я ее приводил ранее. Для 10 гаплотипов она равна 0.264+/-0.032, для 20 гаплотипов 0.284+/-0.024. Как видите, эти величины совпадают в пределах нормальной погрешности.

В-третьих, Ваши годы неверны. Они ни по какой калибровке не прошли бы. Они не стыкуются и с данными Чандлера, и вообще ни с какими. Я же советовал не изобретать велосипед, но охота пуще неволи.

Опять же дело Ваше. Оставайтесь при своем мнении.

Mich Glitch

Делаю просчет только для 50 гаплотипам, чтобы можно было сравнить результат с Анатолием.
Итак, табличка генетических дистанций приложена внизу.
Среднегенетическая дистанция равна 6.9428. Т.е. округленно до целого 7.
Медианная дистанция равна 7.
Иными словами, добавленные гаплотипы выравняли выборку.
Получаем тот же результат, что и на 10 гаплотипах: 2360-2580.

Вся сравнительная табличка теперь выглядит так:

Размер выборки ___ Клёсов _____ Темош
10 гаплотипов _____ 4200+/-670 __ 2360-2580
20 гаплотипов _____ 4575+/-600 __ 2760-2990
.
.
50 гаплотипов _____ 4400+/-500 __ 2760-2990

Итак, несколько выводов.
1) Добавление даже односубкладных гаплотипов иногда (примем полученный результат за частный случай) сильно изменяет топологию референтной группы.
2) Несмотря на значительное расхождение результатов расчета TMRCA, в способах, используемых Клёсовым и Темошем, прослеживаются сходные характеры изменений времен (иными словами, увеличение интервала для 20 гаплотипов, с последующим снижением для 50).
3) Простым изменением используемых доверительных интервалов можно привести получаемые результаты к подтвержденному (в качестве гипотезы, предположим, что со временем найдутся такие возможности).
4) На генеалогических интервалах способ используемый Темошем (да, и, полагаю, Клёсовым) соответствует архивным данным. Иначе и быть не может, так как они (способы) из этих данных выведены.
5) На дальних дистанциях происходит значительное расползание резульатов, полученных двумя методами.

Валерий, а теперь я слёзно прошу Вас - дайте, пожалуйста, результаты времен по этим трём выборкам, получаемые Вашим методом.

Оставим пока взаимное оплёвывание и перебранки по поводу того, чья вера правильнее.

Давайте просто сверим результаты.

Mich Glitch

Анатолий, по пунктам.

1) Мы все понимаем ( ... ) смысл округления и доверительных интервалов. ...

2) Речь сейчас не идёт об обсуждении методов. Например про таблицы я Вас простым языком спросил "как?" ... ... этой таблицей мы всё ещё пользуемся, ...? Если пользуемся, то как?

3) ... Вашу величину 0.00183 не пересчитываю. ... о ней вообще только сейчас услышал. Эта величина близка к общепринятой. ... вернёмся к пункту первому. То Вы ... об абсурдных на Ваш взгляд обилии циферок после запятой, а то вдруг цепляетесь к вопиющей разнице между 0.0021 и 0.0022.

4) Последнее. ... в рамках. Поэтому оставьте ... . ... .
Вернёмся к академическому стилю.

(Вымаранно автором собщения.)

I2a1a

Да. Печально смотреть на такие результаты дискуссии. К сожалению, никто так и не захотел вникнуть в верное, по своей сути, замечание Валерия. А пока со стороны очнь смахивает на диалог глухого и немого, и одновременно - последний диалог Бендера и Воробъянинова

.

I2a1a

Совершенно верно, так оно и происходит при построениях деревьев с корнем в точке "мидпойнта". На MP-древе эта точка (вернее, узел) оказывается в заведомой близость от узла "модала", что неудивительно, так как за модал принимаю медианные значения всех маркеров всех гаплотипов выборки. В принципе, по степени удаленности "мидпойнта" от "модала" можно судить об степени искажения выборки наиболее "выдающимися" из общего ряда гаплотипами.

Возраст выборки в медианно-мидпойнтных сетях получается стабильно-одинаковым.

Цитата: Valery от 13 Сентябрь 2009, 00:08:55

1) Нуль-гипотеза. В Мурке мидпойнт - это точка минимизирующая дисперсию расстояния до всех засвидетельствованных гаплотипов. Находится чаще всего вблизи модала. Поэтому даже если топология - лажа, "возраст" может оказаться стабильным, и более того, во всех случаях, кроме самых патологических, так и будет.

Valery

Ну да. Похоже так и есть. То есть чтобы считать по дереву надо быть уверенным что оно имеет отношение к истине.

aklyosov

Цитата: Mich Glitch от 13 Сентябрь 2009, 08:32:49

Вся сравнительная табличка теперь выглядит так:

Размер выборки ___ Клёсов _____ Темош
10 гаплотипов _____ 4200+/-670 __ 2360-2580
20 гаплотипов _____ 4575+/-600 __ 2760-2990
50 гаплотипов _____ 4400+/-500 __ 2760-2990

Итак, несколько выводов.
1) Добавление даже односубкладных гаплотипов иногда (примем полученный результат за частный случай) сильно изменяет топологию референтной группы.
2) Несмотря на значительное расхождение результатов расчета TMRCA, в способах, используемых Клёсовым и Темошем, прослеживаются сходные характеры изменений времен (иными словами, увеличение интервала для 20 гаплотипов, с последующим снижением для 50).
3) Простым изменением используемых доверительных интервалов можно привести получаемые результаты к подтвержденному (в качестве гипотезы, предположим, что со временем найдутся такие возможности).
4) На генеалогических интервалах способ используемый Темошем (да, и, полагаю, Клёсовым) соответствует архивным данным. Иначе и быть не может, так как они (способы) из этих данных выведены.
5) На дальних дистанциях происходит значительное расползание резульатов, полученных двумя методами.

Давайте просто сверим результаты.

Выводы - одни тривиальные, другие неверные. Третьи типа "ну и что"? То, что я написал выше - (а) гаплотипы - штука упрямая, и (б) даже десяток гаплотипов может дать время общего предка по многомиллионной популяции -

эти выводы и получены.

Но упражнение для новичков полезное, и его стоило было провести. И не нужно лезть на стенку в ответ на замечания. Они были совершеннно справедливы.

Итак, по выводам, чтобы не быть голословным.

1) Добавление даже односубкладных гаплотипов иногда (примем полученный результат за частный случай) сильно изменяет топологию референтной группы.

Это вывод банальный и по формулировке неверный. Любой, кто работал с гаплотипами, знает, что на десятке гаплотипов погрешность расчетов велика. Поэтому здесь не "топология" меняется, а просто погрешность в средней величине мутаций на маркер по данной выборке из 10 гаплотипов равна 12.3% (если не округлять). Плюс погрешность в величине самой скорости мутации, вот и 16%-ная ошибка в величине времени до общего предка (при принятых условиях и допущениях).

В серии из 20 гаплотипов первая погрешность уже меньше, 8.4%.

В серии из 50 гаплотипов она 5.4%. Все-таки 342 мутации на серию - это не так мало.

Все полученные величины - в пределах погрешности расчетов. Ни о каком "изменении топологии" здесь речи быть не может. Если, конечно, не вкладывать в это некий смысл, не противоречащий по сути изложенному выше.

2) Несмотря на значительное расхождение результатов расчета TMRCA, в способах, используемых Клёсовым и Темошем, прослеживаются сходные характеры изменений времен (иными словами, увеличение интервала для 20 гаплотипов, с последующим снижением для 50).

Вывод по сути неверный. Никакого "увеличения" или "уменьшения" там нет. Все цифры в пределах погрешности расчетов. Вы смотрите на средние величины, но их там по сути нет. Это - облако в пределах указанных погрешностей.

3) Простым изменением используемых доверительных интервалов можно привести получаемые результаты к подтвержденному (в качестве гипотезы, предположим, что со временем найдутся такие возможности).

Это я не понял, что к чему привести. Например, археологи найдут, что возраст R1a1 на Русской равнине 7 тысяч лет. Кто к кему "приводить" будем? Просто скажем, что потомки того, ископаемого, не выжили. И никкого "приведения".

4) На генеалогических интервалах способ используемый Темошем (да, и, полагаю, Клёсовым) соответствует архивным данным. Иначе и быть не может, так как они (способы) из этих данных выведены.

Не понял, что за "архивные данные". Я вообще, как СПОСОБ может соответствовать "архивным данным".

5) На дальних дистанциях происходит значительное расползание резульатов, полученных двумя методами.

Расползание только потому, что я ввел поправку на возвратные мутации (с использованием той самой таблицы), а Вы не вводили. И с этой таблицей ввести ее не можете, поскольку она создана для 25 лет на поколение. Вы можете считать поправку математически, но я не понимаю, зачем это делать, когда уже есть таблица для определенной и откалиброванной скорости мутации, причем откалиброванной для 25 лет на поколение. Поэтому и советовал не изобретать велосипед, а просто взять мои данные по скорости мутации и времени на поколение.

Теперь замечание общего характера. Неправильно то, что DYS391 искусственно лишена мутаций, и выборка не отражает истинного распределения мутаций. Поэтому и время до общего предка занижено. На самом деле оно примерно 4800+/-500 лет. Я понимаю, что это только упражнение, но его стоило бы делать на реальных выборках, а не искаженных.

Продолжаем разбор полетов.

1) Мы все понимаем ( ... ) смысл округления и доверительных интервалов. ...

Не знаю, зачем каждый раз дергаться в ответ на справедливые замечания. Повторяю, что писать цифры до 9-го знака, когда достаточно одной-двух, неправильно. Доверительные интервалы Вы не использовали, поэтому насчет понимания смысла не уверен. Когда их посчитаете, тогда увидим, как Вы понимаете из смысл. У меня даны для 95-ных доверительных интервалов.

2) Речь сейчас не идёт об обсуждении методов. Например про таблицы я Вас простым языком спросил "как?" ... ... этой таблицей мы всё ещё пользуемся, ...? Если пользуемся, то как?

Я ясно ответил, что я пользуюсь. Потому и мои цифры намного выше. Вам пользоваться ей нельзя. Причины я привел. Вы же хотите непременно иметь скорости и поколения, отличные от моих. Вот и последствия.

3) ... Вашу величину 0.00183 не пересчитываю. ... о ней вообще только сейчас услышал. Эта величина близка к общепринятой. ...

Ну если близка, то чего ее не использовать? :-))
Это расчитано по величинам Чандлера (для 12-маркерных гаплотипов) и выверено на серии Мак-Дональдов. Величина для 25-маркерных гаплотипов выверена для той же серии. Откуда Вы взяли 0.0021, причем для 25-маркерных гаплотипов, не имею понятия. Хотелось бы знать источник.

>вернёмся к пункту первому. То Вы ... об абсурдных на Ваш взгляд обилии циферок после запятой, а то вдруг цепляетесь к вопиющей разнице между 0.0021 и 0.0022.

Да не на "мой взгляд", а абсурдное обилие цифр после запятой. Разница не вопиющая, а методологическая. Если пересчет - то 0.0022. Если эксперимент (как Вы отметили) то 0.0021. А разницы в отношении расчетов никакой нет, точнее, только 4.5%, что в пределах погрешности расчетов.

4) Последнее. ... в рамках. Поэтому оставьте ... . ... .
Вернёмся к академическому стилю.

Угу. Пока, читая Ваши слова и выражения, заметно плохо.

Надеюсь, мои замечания полезны.

АвторТема: Выборки гаплотипов - теория и практика (Прочитано 30875 раз)

Valery

Re: Выборки гаплотипов - теория и практика

aklyosov

Re: Выборки гаплотипов - теория и практика

aklyosov

Re: Выборки гаплотипов - теория и практика

Valery

Re: Выборки гаплотипов - теория и практика

aklyosov

Re: Выборки гаплотипов - теория и практика

Mich Glitch

Re: Выборки гаплотипов - теория и практика

Mich Glitch

Re: Выборки гаплотипов - теория и практика

aklyosov

Re: Выборки гаплотипов - теория и практика

aklyosov

Re: Выборки гаплотипов - теория и практика

Mich Glitch

Re: Выборки гаплотипов - теория и практика

Mich Glitch

Re: Выборки гаплотипов - теория и практика

I2a1a

Re: Выборки гаплотипов - теория и практика

I2a1a

Re: Выборки гаплотипов - теория и практика

Valery

Re: Выборки гаплотипов - теория и практика

aklyosov

Re: Выборки гаплотипов - теория и практика