АвторТема: Выборки гаплотипов - теория и практика  (Прочитано 30885 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Lesla

  • Главный модератор
  • *****
  • Сообщений: 9633
  • Страна: ru
  • Рейтинг +2928/-9
  • FTDNA: 154400 (Big Y - 283049)
  • Y-ДНК: R1a-YP682 (VK06+)
Re: Выборки гаплотипов - теория и практика
« Ответ #75 : 15 Сентябрь 2009, 09:23:11 »
Дак кто же спорит?
Тут, рядом с Вашим проектом никто и рядом не стоял.
Как только у Вас выявятся реальные генеалогии (по разным веткам Y-гаплогрупп), так тут и МакДональдсов можно переплюнуть будет. И по Вашим генеалогиям считать.
Но это - пока перспективы.
А в Китае еще никто не собирался выявлять ДНК у потомков Конфуция (ок. 551 до н. э. — 479 до н. э.)? Там они, по-моему, официально существуют и даже льготы как потомки имеют.

Оффлайн mouglley

  • ...
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Re: Выборки гаплотипов - теория и практика
« Ответ #76 : 15 Сентябрь 2009, 22:05:58 »
А Вы представляете, что окажутся не потомками.
Столько льгот - и под хвост.
Ежели тяжёлой коммунистической рукой не будут загонять, то никто и не пойдёт.
А, вообще, правильно, что уважают его потомков. Вдруг, кто-нибудь из них столь же великое совершит.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Выборки гаплотипов - теория и практика
« Ответ #77 : 16 Сентябрь 2009, 16:55:06 »
Так и есть. Средняя частота партиций каждой ветви в в результате интерефренции наиболее вероятного древа (древе с максимальной апостериорной вероятностью, см. приложенный файл пдф) и остальных вероятных деревьев (см. файл с расширением TPROBS, где 15497 возможных деревьев по 50 гаплотипной выборке М.Темоша, отсортированы в порядке возрастания кумулятивной апострериорной вероятности) составляет около 0.20...0.30 (синие и голубые ветви на дереве). Кому интересно сравнение всех конфигураций древа, пишите мне на мейл.Вышлю почтой. 

Про топологии еще разок. Я использую нормированный вариант Робинсона-Фоулдса. Расстояние в 0.65 между деревьями у которых 50 исходных гаплотипов означает что ( (число партиций 1-го дерева которые не найдены во 2-м) + (число партиций 2-го дерева которые не найдены во 1-м) ) / 50 = 2/3. При этом для пущей точности я включаю в статистику и тривиальные партиции, то есть такие которые получаются отрыванием листикового гаплотипа. Множество таких партиций почти одинаково у обоих деревьев и значит примерно равно 50. Это означает, что только 1/5 от общего числа объединенных партиций обоих деревьев у них общая.
« Последнее редактирование: 17 Сентябрь 2009, 01:55:01 от Vadim Verenich »

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Выборки гаплотипов - теория и практика
« Ответ #78 : 16 Сентябрь 2009, 16:58:11 »
Дополнительные приложения.

PS. PDF файл смотреть при увеличении 800%.
« Последнее редактирование: 16 Сентябрь 2009, 18:11:18 от Vadim Verenich »

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1381/-7
  • Ultimate Matriarchy
Re: Выборки гаплотипов - теория и практика
« Ответ #79 : 16 Сентябрь 2009, 19:44:45 »
Что ж, теперь благодаря Вадиму мы получили дополнительное подтверждение. Частоты выявляемые по баесовским деревьям сходны с таковыми на пармонистских.

Печально, что люди до сих пор пытаются строить 17-маркерные древа. Наверное немалую роль играет то что несмотря на общий хаос на них выявляются некоторые реальные кластера что вводит в заблуждение относительно достоверности деревьев в целом.

Оффлайн Centurion

  • 100% Earth (Solar System) genofond
  • Администратор
  • *****
  • Сообщений: 9548
  • Страна: ru
  • Рейтинг +571/-2
Re: Выборки гаплотипов - теория и практика
« Ответ #80 : 16 Сентябрь 2009, 19:55:20 »
Валер, что ты привязался к 17-ти?

Зажрались... раньше 6-ти радовались как дети. Щас им 100 подавай. Довольствуйтесь тем, что есть, и есть в больших объемах.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #81 : 16 Сентябрь 2009, 20:34:49 »
Вадим, а нельзя ли с учетом ремарки от Валерия
Печально, что люди до сих пор пытаются строить 17-маркерные древа. Наверное немалую роль играет то что несмотря на общий хаос на них выявляются некоторые реальные кластера что вводит в заблуждение относительно достоверности деревьев в целом.
сделать аналогичное построение на сей раз не по 25 маркерам, а по 67? (В смысле, по моим примерам на основании 67-маркерных гаплотипов от Клёсова.)

Если просчет занимает много времени, то не брать всю выборку в 71 гаплотип, а ограничиться 36 гаплотипной, или даже 18 гаплотипной выборкой?

Очень хочется сопоставить даные.

И потом я пока только на интуитивном уровне не вполне согласен с уважаемым Валерием. Я полагаю, что просто необходимо учитывать величину максимальных генетических разностей. Т.е. для 17 маркерных гаплотипов максимально допустимая генетическая дистанция (соотвественно и интервал достоверной исторической реконструкции) одна, а для 67 маркеров - возможно другая. Соотношение же средней и максимальной генетической дистанции по отношению к длине гаплотипа - примерно одинаково.
Для подтверждения, или опровержения этого тезиска, после того, как рассмотрим данные от Вадима по 67-маркерным гаплотипам, сделаю пример где-то на 80 67-маркерных гаплотипов (выборки в 10, 20, 40, 80 сэмплов) с меньшими генетическими дистанциями.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #82 : 16 Сентябрь 2009, 20:57:24 »
Напомню, что в проанализированной Вадимом 50-гаплотипной выборке 25-маркерных гаплотипов средняя генетическая дистанция (по бесконечной модели) составляет 7.21877551 мутаций на каждый гаплотип. 29% - это много. (Я на 67 маркерах обычно шалю с выборками с максимальной дистанцией не более 5).
Если взять одношаговые мутации (основная модель всех топологий), то цифирь будет вообще огромная.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #83 : 16 Сентябрь 2009, 21:07:51 »
По 67 маркерной выборке из 71 гаплотипа имеем среднюю одношаговую дистанцию 31.36358149 одношаговых мутаций на гаплотип.
А по мутациям вообще (модель бесконечных аллелей) имеем в среднем на гаплотип.24.75995976. Т.е. 37%.

Так вот, если моё предположение верно, то анализ Вадима и по 67-маркерам будет указывать на такую же неопределенность результатов, что и по 25 маркерам.
« Последнее редактирование: 16 Сентябрь 2009, 21:14:10 от Mich Glitch »

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Выборки гаплотипов - теория и практика
« Ответ #84 : 16 Сентябрь 2009, 21:24:50 »
Можно, но быстро не обещаю. Кроме того, мне нужны эти самые 67-маркерные гаплотипы. Я полагаю, что только расчет по цепочкам Маркова (и методу Монте-Карло) займет около 10 часов.  :(

Вадим, а нельзя ли с учетом ремарки от Валерия
Печально, что люди до сих пор пытаются строить 17-маркерные древа. Наверное немалую роль играет то что несмотря на общий хаос на них выявляются некоторые реальные кластера что вводит в заблуждение относительно достоверности деревьев в целом.
сделать аналогичное построение на сей раз не по 25 маркерам, а по 67? (В смысле, по моим примерам на основании 67-маркерных гаплотипов от Клёсова.)

« Последнее редактирование: 17 Сентябрь 2009, 01:57:04 от Vadim Verenich »

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #85 : 16 Сентябрь 2009, 21:29:55 »
Кроме того, мне нужны эти самые 67-маркерные гаплотипы.
Вадим, вот они (ссылка), на предыдущей страничке. В четырёх моих сообщениях.
Утонули в потоках ругани.  :-[

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1381/-7
  • Ultimate Matriarchy
Re: Выборки гаплотипов - теория и практика
« Ответ #86 : 16 Сентябрь 2009, 21:30:08 »
Так вот, если моё предположение верно, то анализ Вадима и по 67-маркерам будет указывать на такую же неопределенность результатов, что и по 25 маркерам.

Думаю, нет. У меня было как минимум двукратное улучшение результатов. Михаил, поймите: мы сейчас с Вадимом рассматриваем число локусов в связи с наиболее радикальной проблемой - исходя из таких-то принципов расчета деревьев, решить вопрос дает или нет выборка однозначную реконструкцию истории. А Вы пытаетесь увязать эту проблему с другими, Вам более интересными, и совершенно зря. Потому что выборки которые Вы планируете рассматривать в будущем наверняка будет содержать очень большУю долю близких родственников разделившихся за последние 500 лет, для которых 67 локусов достаточны и может более чем достаточны. А общий случай - это когда типа есть бразилец индус русский поляк и француз и все они R1a. Разница огромная. Может быть, Вы Михаил конкретизируете претензии и мы ответим более прицельно?

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #87 : 16 Сентябрь 2009, 21:39:10 »
Михаил, поймите: мы сейчас с Вадимом рассматриваем число локусов в связи с наиболее радикальной проблемой - исходя из таких-то принципов расчета деревьев, решить вопрос дает или нет выборка однозначную реконструкцию истории. А Вы пытаетесь увязать эту проблему с другими, Вам более интересными, и совершенно зря.
Валерий.
А вот и нет.
Я думал, что мысль моя настолько проста, что не требует разъяснений.

А выходит надо объясниться.

Так ведь и я о том же. О реконструкции истории.

Первый вопрос следующий: какой должна быть минимальная длина гаплотипа при достоверной реконструкции на заданную глубину.

Следующий вопрос звучит так: какой должна быть максимально допустимая относительная генетическая дистанция при достоверном построении.

Третий вопрос заключается в общей оценки достоверности.

Поэтому Ваше отрицание 17 маркерных гаплотипов считаю совершенно неверным. При среднегенетических дистанций в 1-2 одношаговые мутации, думаю, что картину они дадут однозначную. Опять же следует делать увязку с размерами выборки.

Прошу Вадима сделать просчет, с тем чтобы убедиться в правильности, или ложности своих предположений.

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1381/-7
  • Ultimate Matriarchy
Re: Выборки гаплотипов - теория и практика
« Ответ #88 : 16 Сентябрь 2009, 21:47:14 »
Я полагаю, что просто необходимо учитывать величину максимальных генетических разностей. Т.е. для 17 маркерных гаплотипов максимально допустимая генетическая дистанция (соотвественно и интервал достоверной исторической реконструкции) одна, а для 67 маркеров - возможно другая. Соотношение же средней и максимальной генетической дистанции по отношению к длине гаплотипа - примерно одинаково.

Кажись я догнал :)

Первое. Вы ожидаете от филогении такой же линейности? Я уже ничего не ожидаю. Но с увеличением количества маркеров при той же средней попарной гомоплазии наверное догнать реально. Может устаканится все на 120 локусах!

Второе. Если в качестве параметра используется дистанция на 17-локусных гаплотипах то нужно экспериментальное подтверждение того какой будет дистанция на соответствующих 67-локусных. Ведь надо как-то учитывать что определенный % окажется ложнородственным и имеющим на 67 дистанцию много более среднеожидаемой. Если такие цифры есть я бы с удовольствием взглянул.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #89 : 16 Сентябрь 2009, 21:51:07 »
Первое. Вы ожидаете от филогении такой же линейности? Я уже ничего не ожидаю. Но с увеличением количества маркеров при той же средней попарной гомоплазии наверное догнать реально. Может устаканится все на 120 локусах!
Валерий, я увязываю число маркеров с глубиной.
То есть ответ примерно такой, что со 120 маркерами устаканится на глубине 5000 лет.
А не так, что устаканится вообще. Или Вы имеете в виду конечный интервал человеческой истории лет в 100 тысяч?

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.