АвторТема: Выборки гаплотипов - теория и практика  (Прочитано 30644 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн aklyosov

  • Сообщений: 117
  • Рейтинг +11/-8
Re: Выборки гаплотипов - теория и практика
« Ответ #45 : 13 Сентябрь 2009, 16:24:19 »
Ну да. Похоже так и есть. То есть чтобы считать по дереву надо быть уверенным что оно имеет отношение к истине.

Угу. Веревка - вервие простое. (С)

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #46 : 13 Сентябрь 2009, 16:37:49 »
Да. Печально смотреть на такие результаты дискуссии. К сожалению, никто так и не захотел вникнуть в верное, по своей сути, замечание Валерия. А пока со стороны очнь смахивает на диалог глухого и немого, и одновременно - последний диалог Бендера и Воробъянинова  ;D.
Вадим,
Валерий,
Анатолий,


Дискуссия, мало того, что скатилась на привычную неконструктивную колею, так ещё и попросту ушла от темы.

Тема обозначена, как изучение влияния выборки на достоверность получаемых результатов.

Никто не спорит с тем, что изменение размеров выборки оказывает сильное влияние на топологию.

Хотелось бы рассмотреть взаимодействие размеров выборки и TMRCA. При этом обсуждение этих самых методов расчетов TMRCA оставить пока за рамками обсуждения.
Кто-то не понимает попыток создания метода расчета TMRCA, базирующегося только на вероятностно-статистическом распределении и полностью независимого от топологии.
Кому-то попытки использования величин, полученных на основе анализа скачущей топологии (речь о скоростях мутаций и поколенном интервале) кажутся абсурдными.

Речь не об этом.

Хотелось бы просто рассмотреть влияние выборок на тот, или иной способ.
С топологией разобрались и будем разбираться (построения с Мегой и Сплитом я представлю). Уже понятно, что даже при казалось бы при достаточно однородных данных, простое изменение размеров выборки приводит к значительным коррекциям топологии.

По TMRCA пока две, казалось бы разные методы показали сходную выборконезависимую :) тенденцию. (На самом деле, если отвлечься от разности получаемых конечных цифр, у баз этих двух способов расчета TMRCA - много сходства.)

Для завершения целостности картины, хотелось бы иметь просчёты TMRCA по трём вышеприведённым выборкам (10, 20, 50 гаплотипов) автоматически  :o сгенерированные Муркой.

Валерий, поэтому ещё раз попрошу, на основании уже имеющихся файлов (они приложены к мои первым сообщениям в ветке), озвучьте, пожалуйста, получаемые с помощью Мурки результаты по TMRCA.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #47 : 13 Сентябрь 2009, 17:04:41 »
Анатолий, опять Вы со своей бестолковщиной.

- Это вывод банальный и по формулировке неверный.
- Вы определитесь, либо банальный (т.е. настолько общепринятый, что и толковать нечего), либо неверный. Ох, уж это Ваше всегдашнее отсутствие логики!

- Вывод по сути неверный. Никакого "увеличения" или "уменьшения" там нет. Все цифры в пределах погрешности расчетов. Вы смотрите на средние величины, но их там по сути нет. Это - облако в пределах указанных погрешностей.
- Уже говорил, что со статистикой, вероятностью и матраспределением - Вы не дружите. Ну, не понимаете её и всё. Мозг гуманитария, так сказать. Как Вас в химию занесло?
Если я скажу, что доходность вложения в лотерею составляет 0.75 Вы это поймёте? Или будете говорить, что выигрыш с вероятностью 1 из 13 миллионов находится в пределах погрешности?

- Это я не понял, что к чему привести. Например, археологи найдут, что возраст R1a1 на Русской равнине 7 тысяч лет. Кто к кему "приводить" будем? Просто скажем, что потомки того, ископаемого, не выжили. И никкого "приведения".
- Вижу, что не поняли. Вижу, что не понимаете. Помимо Вашего неумения и нежелания слушать кого-то другого кроме себя, имеют место причины изложенные в предыдущем пункте.
Объясняю. Можно вывести характер общей зависимости TMRCA от, скажем, генетических дистанций рассматриваемых гаплотипов (это альфа и омега любого из используемого методов; основа ДНК-генеалогии). Величина доверительного интервала при этом берётся волюнтаристки-произвольная. Вы можете объяснить внятно, почему 50%? Или 75%? Или 90%? Или те же Ваши абсурдные (потому как на искаженных краях интервала) 95%?!
А теперь представим, что получили какие-то подтверждения. Не Ваши очередные высосанные из пальца считалки, а что-нибудь более материальное. Ну, какой-нибудь там новый точный способ изучения дДНК вкупе с государственной программой ДНК идентификации всех находимых останков и нынеживущего населения. Или какую другую фантастическую вещь, которая позволила с другого бока оценить реальное TMRCA. Так вот, если общей характер исчисления времен верный, то простое изменение начального доверительного интервала с 50% до, скажем, 64% позволит получать результаты близкие к реальному.

Прервусь пока.
Во-первых, Вы длиные посты можете только писать, но не читать. Так что к чему время терять на ответы по зряшным вопросам.
Во-вторых, не хочу уходить от темы обсуждения влияния выборок в вопросы связанные с обсуждением методологий.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #48 : 13 Сентябрь 2009, 17:22:39 »
Цитировать
Вы же хотите непременно иметь скорости и поколения, отличные от моих.
В том то и дело, что не Ваши.
Вы как лягушка-путешественница, вопящая "Это я придумала!".
Нет. Не Вы придумали.
Вы просто разобрались и обрадовались тому, что поняли.
Можно сделать миллион расчетов по теореме Пифагора, а потом вопить, что теорема верна, именно благодаря этим расчетам.

Посмотрите на это:
FTDNA Y?12 STR  0.0020
FTDNA Y?25 STR 0.0023
FTDNA Y?37 STR 0.0033
FTDNA Y?67 STR 0.0028
SMGF STR set (no 464)   0.0021
All 118 available Y STR    0.0025
Источник.
Копирайты 2003 года.
Последнее обновление октябрь 2006 года.
Вас тогда Centurion  ещё не научил деревья строить?

Сейчас будете глупость говорить, что нельзя скорость от SMGF (самую экспериментально выверенную) использовать на гаплотипы разной длины. То есть опять вот так всерьёз будете думать, что Вы умный, а остальные полные дурачки.

Простая мысль о том, что если Вы используете среднемаркерную скорость в пределах одного гаплотипа, то можно (осознавая сопутствующее понижение точности) использовать среднюю скорость и на разных гаплотипах, Вам в голову не укладывается. Я вообще короткие гаплотипы не пользую. Так, что и вопрос снимается.
 

Оффлайн aklyosov

  • Сообщений: 117
  • Рейтинг +11/-8
Re: Выборки гаплотипов - теория и практика
« Ответ #49 : 13 Сентябрь 2009, 17:26:53 »
Я уже не обращаю внимания на Ваш, Михаил, стиль "дискуссии". Похоже на реченедержание инфантила для самоутверждения. Видимо, так оно и есть. Причем перемежание взываниями к корректности. Тьфу.

Я уже понял, что наши ментальности несовместимы, но продолжаю хотя бы для того, чтобы кто-то интересующийся ДНК-генеалогией усвоил базовые положения.

Итак,

Тема обозначена, как изучение влияния выборки на достоверность получаемых результатов.

Это опять диффузное утверждение, поскольку понятие "достоверность" в данном случае не определено.

На мой взгляд, ответ на один вопрос уже получен. Все три выборки - в 10, 20 и 50 гаплотипов дали одну и ту же величину в пределах погрешности расчетов. "Гаплотипы - упрямая вещь".

Теперь вопрос следующий - насколько полученные величины "достоверны", если под достоверностью понимать корректность расчетов? Ответ - Ваши расчеты некорректны и недостоверны. В них не учтен вклад возвратных мутаций, поэтому полученные годы занижены почти вдвое.

Вопрос третий - насколько полученные величины "достоверны", если под достоверностью понимать соответствие историческим данным? Ответ - Ваши расчеты некорректны и недостоверны. Они не согласуются ни с историей Русской равнины, ни с археологией. Причины даны в пункте выше.

Вопрос четвертый - почему Ваши данные недостоверны, а мои достоверны (в разумных пределах, обычно удовлетворяющих специалистов)? Ответ - потому что Вы упрямы и не хотите слушать более опытных специалистов. Потому что хотите непременно брать "свои" данные, не подводя под них базы, и теряя возможность использовать удобные таблицы.

Как хотите. Все остальное в Вашей писанине (цитируется ниже) - некие прыжки и гримасы. 

Вы не понимаете написанного. Я написал - вывод банальный и ПО ФОРМУЛИРОВКЕ неверный. Слова "формулировке" Вы не увидели. Или не поняли. И тут же пошла инфантильность.
  
Анатолий, опять Вы со своей бестолковщиной.

- Это вывод банальный и по формулировке неверный.
- Вы определитесь, либо банальный (т.е. настолько общепринятый, что и толковать нечего), либо неверный. Ох, уж это Ваше всегдашнее отсутствие логики!

- Вывод по сути неверный. Никакого "увеличения" или "уменьшения" там нет. Все цифры в пределах погрешности расчетов. Вы смотрите на средние величины, но их там по сути нет. Это - облако в пределах указанных погрешностей.
- Уже говорил, что со статистикой, вероятностью и матраспределением - Вы не дружите. Ну, не понимаете её и всё. Мозг гуманитария, так сказать. Как Вас в химию занесло?
Если я скажу, что доходность вложения в лотерею составляет 0.75 Вы это поймёте? Или будете говорить, что выигрыш с вероятностью 1 из 13 миллионов находится в пределах погрешности?

- Это я не понял, что к чему привести. Например, археологи найдут, что возраст R1a1 на Русской равнине 7 тысяч лет. Кто к кему "приводить" будем? Просто скажем, что потомки того, ископаемого, не выжили. И никкого "приведения".
- Вижу, что не поняли. Вижу, что не понимаете. Помимо Вашего неумения и нежелания слушать кого-то другого кроме себя, имеют место причины изложенные в предыдущем пункте.
Объясняю. Можно вывести характер общей зависимости TMRCA от, скажем, генетических дистанций рассматриваемых гаплотипов (это альфа и омега любого из используемого методов; основа ДНК-генеалогии). Величина доверительного интервала при этом берётся волюнтаристки-произвольная. Вы можете объяснить внятно, почему 50%? Или 75%? Или 90%? Или те же Ваши абсурдные (потому как на искаженных краях интервала) 95%?!
А теперь представим, что получили какие-то подтверждения. Не Ваши очередные высосанные из пальца считалки, а что-нибудь более материальное. Ну, какой-нибудь там новый точный способ изучения дДНК вкупе с государственной программой ДНК идентификации всех находимых останков и нынеживущего населения. Или какую другую фантастическую вещь, которая позволила с другого бока оценить реальное TMRCA. Так вот, если общей характер исчисления времен верный, то простое изменение начального доверительного интервала с 50% до, скажем, 64% позволит получать результаты близкие к реальному.

« Последнее редактирование: 14 Сентябрь 2009, 00:57:10 от aklyosov »

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #50 : 13 Сентябрь 2009, 17:33:09 »
Последнее.
Если ученый не способен объяснить 11-летнему мальчику чем он занимается, то это не ученый, а шарлатан. © К.Воннегут
(Надеюсь Вы понимаете, что ученый - это не про Вас. Просто цитата такая.)


По поводу таблицы.

Сразу говорил, что это дрянь полнейшая. Базируется на совершенно неверных методологических принципах.

Ваше нежелание (неумение?) дать инструкции - полное тому подтверждение.
Речь идёт о том, что немногие из Ваших оставшихся последователей пользуют эту табличку совершенно диким образом:
- берут общее количество мутаций в выборке (не делая разницы ни между одношаговыми, ни по модели бесконечных аллелей);
- делят на количество маркеров;
- делят на количество гаплотипов;
- суют в первый столбец;
- получают полнейшую ерунду.

Вы ограничились объяснениями типа, вещь эта настолько сложна, что тебе её просто не понять. Боюсь, это Вы не разобрались в немного графоманских матвыкладках Адамова. (Если вообще делали попытки разобраться.)

Оффлайн aklyosov

  • Сообщений: 117
  • Рейтинг +11/-8
Re: Выборки гаплотипов - теория и практика
« Ответ #51 : 13 Сентябрь 2009, 17:40:16 »
Цитировать
Вы же хотите непременно иметь скорости и поколения, отличные от моих.
В том то и дело, что не Ваши.

 ;D

Ладно, проехали. Про инфантильность и попытки самоутверждения я уже пояснил в сообщении выше. Это у вас уже стало идеей-фикс. Типа Эллочки-людоедки в борьбе с Вандербильдихой. Смешно и грустно читать. 


Посмотрите на это:
FTDNA Y?12 STR  0.0020
FTDNA Y?25 STR 0.0023
FTDNA Y?37 STR 0.0033
FTDNA Y?67 STR 0.0028

Сейчас будете глупость говорить, что нельзя скорость от SMGF (самую экспериментально выверенную) использовать на гаплотипы разной длины. То есть опять вот так всерьёз будете думать, что Вы умный, а остальные полные дурачки.

Простая мысль о том, что если Вы используете среднемаркерную скорость в пределах одного гаплотипа, то можно (осознавая сопутствующее понижение точности) использовать среднюю скорость и на разных гаплотипах, Вам в голову не укладывается.. Так, что и вопрос снимается.

А теперь перечитайте то, что написали в последнем абзаце, и посмотрите сюда:

FTDNA Y?12 STR  0.0020
FTDNA Y?25 STR 0.0023
FTDNA Y?37 STR 0.0033
FTDNA Y?67 STR 0.0028

Ну и как? Как насчет той же "среднемаркерной" скорости на разных гаплотипах? Вы видите разницу в 65% (!!)?

Ладно, продолжайте. Я выхожу из этого... как бы это помягче... Вы поняли. Ну, типа "обсуждения". Эллочкой-Людоедкой. 

 

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #52 : 13 Сентябрь 2009, 17:45:40 »

Тема обозначена, как изучение влияния выборки на достоверность получаемых результатов.

Это опять диффузное утверждение, поскольку понятие "достоверность" в данном случае не определено.

На мой взгляд, ответ на один вопрос уже получен. Все три выборки - в 10, 20 и 50 гаплотипов дали одну и ту же величину в пределах погрешности расчетов. "Гаплотипы - упрямая вещь".
С этим я согласен.
В том смысле, что на расчеты TMRCA для всей выборки по разным способам показали независимость от величины выборки.
Почему?
Да потому как Ваше утверждение о том, что нельзя рассчитывать TMRCA без учета топологии - хрень полная. Ещё как можно. Нужно. И рассчитывается.
Начиная от сравнения пары и до тысячных выборок.
Всё, как Вы говорите, находится в пределах погрешности.

Что до топологии, то она скачет. Думаю, что нелинейно. Т.е. только при совсем уж малых выборках. Иными словами если увеличить сами выборки, число рассматриваемых гаплотипов, и (самое главное) использовать гаплотипы с малыми попарными гендистанциями - то увеличение выборки будет незначительно изменять общую топологию референтной группы.
Иными словами, речь идёт о повышении достоврености и однозначности получаемых результатов.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #53 : 13 Сентябрь 2009, 17:59:01 »
Ладно, продолжайте. Я выхожу из этого... как бы это помягче... Вы поняли. Ну, типа "обсуждения". Эллочкой-Людоедкой. 
Раз у нас уже пошел стиль из нетленного, то посмотрите сюда, нелепый старик ©:
MutRate = new Array(0.000905204,0.003263219,0.001452943,0.001453,0.002969927,0.001796941,0.002810536,0.00025561,0.00037561,0.004245652,0.002049329,0.001123324,0.002411602,0.005288899,0.000845716,0.001401044,0.000276189,0.000143146,0.003265811,0.001447476,0.001899493,0.006024892,0.002561478,0.002973977,0.003795204,0.003502946,0.003503,0.003503,0.003503,0.003045751,0.002960012,0.000759308,0.001685843,0.00526851,0.00558426,0.007799604,0.006111277,0.010083861,0.010276061,0.00301618,0.000859114,0.002,0.001123759,0.002510834,0.000808631,0.002669672,0.001480508,0.001976559,0.000451882,0.00137858,0.000785697,0.003222633,0.002000343...

Вы поняли, что это?

Скорости мутаций по маркерам.
Допустим, 0.000785697 против 0.004245652.
Меньше в 5.4 раза!!!

В пределах одного гаплотипа!!!

Вы это кушаете и не давитесь.

Я же сказал, что начнете бубнить - и не ошибся.
У FTDNA скорости производные. Как у Чандлера. Как у Вас (Чандлер, прости что поминаю АК в одной строке с тобой  :'( ).
У SMGF полученные по парам отец-сын. Ни у кого такой базы как у них нет. Более 100 тысяч пар они использовали для просчета поколенного интервала и несколько тысяч данных фамильного тестирования для калибровки скоростей мутаций.
Для меня данные от SMGF предпочтительнее.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Выборки гаплотипов - теория и практика
« Ответ #54 : 13 Сентябрь 2009, 19:18:55 »
Прошу прощения за наглость, отвечу от имени Валерия.
Насколько я понял, его как раз мало интересуют расчеты TMRCA, к тому же в Мурке для вычисления возраста узлов  используется ро-статистика (привязанная к среднему числу мутаций), у которой есть серьезные недостатки (в том числе в плане столь любимых АК погрешностей). Имхо, его больше интересует достоверность топологии древ, также как впрочем, и меня, а также (in my humble opinion) wertnera.
Отсюда уменьшение интервала погрешности с увеличением возрастом, отсюда и парадоксальные возрасты (кто работал с муркой, знают о чем речь). За это рхо-статистику уже многократно критиковали, и на эту тему написана уже не одна научная статья. Но обвинять уважаемого Валерия за эти недостатки не следует, все претензии к Форестеру и алиа. :) Впрочем, ясно, что и в других методах есть существенные недочеты. 

Валерий, поэтому ещё раз попрошу, на основании уже имеющихся файлов (они приложены к мои первым сообщениям в ветке), озвучьте, пожалуйста, получаемые с помощью Мурки результаты по TMRCA.

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: Выборки гаплотипов - теория и практика
« Ответ #55 : 13 Сентябрь 2009, 19:35:11 »
Цитировать
Прошу прощения

Вадим, Вы в возрастах (как Ро так и других) компетентны мильон раз больше меня поэтому это будет с моей стороны наглостью спорить с Вами

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: Выборки гаплотипов - теория и практика
« Ответ #56 : 13 Сентябрь 2009, 19:38:23 »
Цитировать
Да потому как Ваше утверждение о том, что нельзя рассчитывать TMRCA без учета топологии - хрень полная

Выходит что так. "Чохом" не дозволено считать только Животовскому.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Выборки гаплотипов - теория и практика
« Ответ #57 : 13 Сентябрь 2009, 19:49:29 »
Имхо, АК как раз имел ввиду обратное.

Цитировать
Да потому как Ваше утверждение о том, что нельзя рассчитывать TMRCA без учета топологии - хрень полная.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Выборки гаплотипов - теория и практика
« Ответ #58 : 13 Сентябрь 2009, 19:50:43 »
Понятно.
Топология, так топология.
Тем более, что временные расчеты на топологию не подвязаны.
А разница между моими и клесовскими результатами вызвана разными используемыми скоростями.
Ну, и конечно подходами.
Мой подход заключается в использовании средней скорости, полученной экспериментально.
Клесовцы же предпочитают опосредственные производные величины с учетом только отдельных факторов и игнорированием прочих.
Займусь сейчас построениями по 9, 18, 36 и 71 67-маркерным гаплотипам.
Все промежуточные файлы выложу.

Анатолий. Для Вас хорошая новость. У 23эндМи скидка больше чем в два раза. Всё счастье (если связаться с napobo3, который получил сброшенные цены для бета тестирования новых опций от 23эндМи) стоит каких-то 149 долларов.

Думаю, что даже самый скромный бюджет такую сумму выдержит. Хотя Бостон, оно конечно, город дорогой. Возможно многим не до жиру.  ::)

Если вдруг решитесь немножечко расширить свой кругозор, смотрите здесь (ссылка).

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: Выборки гаплотипов - теория и практика
« Ответ #59 : 13 Сентябрь 2009, 19:55:54 »
Имхо, АК как раз имел ввиду обратное.

Цитировать
Да потому как Ваше утверждение о том, что нельзя рассчитывать TMRCA без учета топологии - хрень полная.


Признал скажем так под давлением общественности :)

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.