АвторТема: Некоторые проблемы STR-филогении  (Прочитано 23295 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн ОводАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Alexander:
Цитировать
Вряд ли стоило мне вмешиваться в дискуссию авторитетов. Но сомневаюсь в реальности качественного дерева. Как его проверить? Пробовал проверить прогонкой выборки (порядка 300 шт. 67-маркерных, и с в общем-то ожидаемым результатом) в разных программах. Но сравнивая Филип (3 варианта), Нетворк, ТНТ (обе с различными укоренениями) - добиться явных совпадений структуры не смог. Возможно, какая-то структура верна. Но чем её подтвердить? Полагаю, что в Мурке будет очередное не совпадаюшее ни с чем дерево. Нужен какой-то критерий качества дерева.

Единственно-правильного (истинного) дерева по СТР Вы никогда не получите. Максимум - набор вариантов.
 
Лишь сравнивая их и выделяя устойчивые в смысле монофилии ветки можно прийти к обоснованному заключению. И то - лишь по отдельным фрагментам.
« Последнее редактирование: 06 Май 2011, 21:43:37 от Овод »

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Некоторые проблемы STR-филогении
« Ответ #1 : 06 Май 2011, 19:16:14 »
Совершенно верно.  Мне кажется, что многих из оппонентов, которые настаивают на существовании единственно-правильного дерева (т.е единственного филогенетического решения), не до конца понимают разницу между контекстом максимального правдоподобия гаплодерева (разновидностью которого является максимально парсимонические дерева, или оптимальные деревья) и контекстом истинного генеалогического дерева. Если в первом контексте можно дать мат.статистическую оценку правдоподобия, то во втором случае никаких подобных мат.статистических критериев не существует. Дерево может быть сколько угодно оптимальным, и при этом не соответствовать реальной генеалогии.
И наоборот.

Хуже того, последние данные по новым SNP, показывает, что STR не очень надежны в качестве класса эквивалентности, индуцирующего разбиение множества STR-гаплотипов на непустые подмножества ("кластеры" или "партиции") элементов множества STR-гаплотипов. В последнее время стали все чаще попадаться случаи, когда разбиение множества групп гаплотипов по бинарному признаку SNP не соответствует кластерному STR-членению (получаемого во всех перечисленных программах).





Оффлайн wertner

  • ...
  • Сообщений: 1332
  • Страна: ru
  • Рейтинг +321/-0
    • YFull
  • Y-ДНК: E-V13->E-S2972->E-Z16661
  • мтДНК: U4a (xU4a3)
Re: Некоторые проблемы STR-филогении
« Ответ #2 : 06 Май 2011, 21:00:20 »
Хуже того, последние данные по новым SNP, показывает, что STR не очень надежны в качестве класса эквивалентности, индуцирующего разбиение множества STR-гаплотипов на непустые подмножества ("кластеры" или "партиции") элементов множества STR-гаплотипов. В последнее время стали все чаще попадаться случаи, когда разбиение множества групп гаплотипов по бинарному признаку SNP не соответствует кластерному STR-членению (получаемого во всех перечисленных программах).
Очень интересно. Каждый такой случай хороший повод совершенствовать филогению. Можете привести конкретные примеры?

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Некоторые проблемы STR-филогении
« Ответ #3 : 06 Май 2011, 21:05:54 »
Из последнего - заявление Нордведта о новой топологии дерева I

Цитировать
n the meantime 23andMe had accumulated more than a dozen derived L460+ results from folks in the various I2a..... and I2b.... clades (..... means any additional downstream designations) This means the early time structure of haplogroup I tree is changed from what I thought it would be from STR interclade variance or GD considerations. The I2 branch line is even more ancient now. Four branch lines to i1, I2a, I2, I2b separate from each other at about the same time 20,000 years ago. The node where the I2a and I2b branch lines separate being the latest event.

Если этот снип включат в новую версию ISOGG дерева, то номенклатура субкладов I2 поменяется кардинальным образом.




Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Некоторые проблемы STR-филогении
« Ответ #4 : 06 Май 2011, 21:25:23 »
Напомню, что в июне прошлого года у нас был спор с Нордтведтом по поводу топологии и порядка ветвления узлов I2, I2a и I2b.

Тогда Нордтведт говорил следущее

Цитировать
I believe the interclade variances between the I2* clades and the I2a clades
and the I2b  clades, and the interclade variances between those latter two,
are collectively best compatible with the scenario in which I2a line first
leaves I2* line and later the I2b line leaves the I2* line.


Your tree should be one of these three scenarios unless you had a node with
three lines coming downstream from it --- one to I2, one to I2a, and one to
I2b?

The three options below in I tree early structure are all compatible with
today's KNOWN snps. But variance and GD distances between haplotype
populations of today's haplogroups are in my view clearly more compatible
with the first shown tree.  Future snp discoveries in key branch segments of
the I tree will confirm one of these three structures and rule out the
alternatives.


Time runs from right to left.

A.

My preferred structure based on the interclade distance matrix
 I2b_____________________________
 I2______________________________|______
 I2a___________________________________|___
 I1_______________________________________|_______

Two alternative structures also compatible with presently known snps.

B.
 I2a_____________________________
 I2______________________________|______
 I2b___________________________________|___
 I1_______________________________________|_______

С.

I2b______________________________
I2a______________________________|____
I2___________________________________|____
I1_______________________________________|_______
"

Нордведт упомянул три возможных сценария, исходя из известных в июне 2010 года снипов. Поскольку он опирался на рассчитанные величины дисперсии и GD между кладами I2 (интеркладовая матрица), то выбрал в качестве наиболее вероятного сценарий A.

Я же исходил из наиболее вероятной топологии оптимального дерева, полученного в программе TNT.  Поэтому моей вариант наиболее точно отражен в сценарии B


После обнаружения снипа L460+  оказалось, что как сценарий А вытекающий из просчитанной КН величины дисперсии (и соответственно GD), так и мой "филогенетический" сценарий максимальной парсимонии (сценарий B) оказались неверным.

А оказался верным совсем иной сценарий C, который и я, и Нордтведт считали наименее верным.

Вот такая вот наука людям, которые надеются на нахождение единственного правильного дерева по STR-филогении или дисперсии (тех же значений Y-STR локусов). Достаточно одного неожиданного снипа, и все максимально   правдоподобные сценарии отправляются на склад истории.  ;D

Такие вот дела.
« Последнее редактирование: 06 Май 2011, 21:40:37 от I2a2a »

Оффлайн ОводАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Некоторые проблемы STR-филогении
« Ответ #5 : 06 Май 2011, 22:44:58 »
Хотел бы обратить внимание ещё на один аспект: исходно филогения развивалась в русле эволюционной биологии достаточно редких событий морфообразования видов. Причём исследователь сам решал - какие признаки и измерения ему включить в рассмотрение, а какие - нет. Есть чёткий критерий их непротиворечивости в матрице состояний исходных таксонов. То есть - был возможен (и реально необходим) их отбор.
 
Уже в снип-филогении (например - мито) этот принцип применим лишь отчасти: количесво нуклеотидов ограничено, для дерева с хорошим разрешением выбраковка нежелательна. Пошли споры, как толковать противоречащие признаки - как ложные высказывания (логико-лингвистический подход) или статистический массив измерений с возможными ошибками. Поскольку на самом деле и то и другое по большому счёту неверно. И ещё - исторические события невозможно повторить в натуре. Эксперименты исключены.
 
Дальше - хуже. В СТР-филогении эти противоречия стали глобальными. Если убирать противоречащие маркеры или таксоны - ни одного может не остаться. Не спасает также статистика, т.к. для древовидной структуры при сплошь конвергентном плюс параллельном развитии событий невозможен (или спорен) один из основных фундаментов статистического вывода - закон больших чисел. То есть при увеличении числа наблюдений (таксонов или маркеров) не обеспечивается сходимость к верному решению при критической массе противоречий, которые возрастают при пополнении дерева или введении новых СТР-маркеров.
 
Так что СТР-филогения, можно сказать - незаконнорожденное дитя кладистики. Но всё ещё - жива. И при аккуратном употреблении - вполне способна порадовать нас верными предсказаниями.
 
Но - при очень аккуратном.
 
 
« Последнее редактирование: 06 Май 2011, 23:50:45 от Овод »

Оффлайн Centurion

  • 100% Earth (Solar System) genofond
  • Администратор
  • *****
  • Сообщений: 9548
  • Страна: ru
  • Рейтинг +571/-2
Re: Некоторые проблемы STR-филогении
« Ответ #6 : 06 Май 2011, 23:02:59 »
Эти бы слова да АКадемику в уши.  :)

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Некоторые проблемы STR-филогении
« Ответ #7 : 07 Июль 2011, 11:09:00 »
Хуже того, последние данные по новым SNP, показывает, что STR не очень надежны в качестве класса эквивалентности, индуцирующего разбиение множества STR-гаплотипов на непустые подмножества ("кластеры" или "партиции") элементов множества STR-гаплотипов. В последнее время стали все чаще попадаться случаи, когда разбиение множества групп гаплотипов по бинарному признаку SNP не соответствует кластерному STR-членению (получаемого во всех перечисленных программах).
Очень интересно. Каждый такой случай хороший повод совершенствовать филогению. Можете привести конкретные примеры?

То есть ситуация при которой люди с более близким ко мне генетическим расстоянием (по Y-DNA matches на ФТДНА) вдруг оказываются на других ветках по филогении является нормальной?
Кроме этого "личного замечания" есть и более глобальное явление, наблюдаемое при построении дерева гаплогруппы Q1b. Гаплотипы с подтвержденными снипами ложатся стабильно и относительно ровно на отдельные ветви. Что касается кластеров, сформированных по двум маркерам (DYS385, DYF395S1), то при филогении часть кластеров "рассыпается"...

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Некоторые проблемы STR-филогении
« Ответ #8 : 07 Июль 2011, 11:35:58 »
Хуже того, последние данные по новым SNP, показывает, что STR не очень надежны в качестве класса эквивалентности, индуцирующего разбиение множества STR-гаплотипов на непустые подмножества ("кластеры" или "партиции") элементов множества STR-гаплотипов. В последнее время стали все чаще попадаться случаи, когда разбиение множества групп гаплотипов по бинарному признаку SNP не соответствует кластерному STR-членению (получаемого во всех перечисленных программах).
Очень интересно. Каждый такой случай хороший повод совершенствовать филогению. Можете привести конкретные примеры?

То есть ситуация при которой люди с более близким ко мне генетическим расстоянием (по Y-DNA matches на ФТДНА) вдруг оказываются на других ветках по филогении является нормальной?
Кроме этого "личного замечания" есть и более глобальное явление, наблюдаемое при построении дерева гаплогруппы Q1b. Гаплотипы с подтвержденными снипами ложатся стабильно и относительно ровно на отдельные ветви. Что касается кластеров, сформированных по двум маркерам (DYS385, DYF395S1), то при филогении часть кластеров "рассыпается"...

Это нормально.
Y-STR филогения всегда носит гадательный характер.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Некоторые проблемы STR-филогении
« Ответ #9 : 07 Июль 2011, 13:24:56 »
Хуже того, последние данные по новым SNP, показывает, что STR не очень надежны в качестве класса эквивалентности, индуцирующего разбиение множества STR-гаплотипов на непустые подмножества ("кластеры" или "партиции") элементов множества STR-гаплотипов. В последнее время стали все чаще попадаться случаи, когда разбиение множества групп гаплотипов по бинарному признаку SNP не соответствует кластерному STR-членению (получаемого во всех перечисленных программах).
Очень интересно. Каждый такой случай хороший повод совершенствовать филогению. Можете привести конкретные примеры?

То есть ситуация при которой люди с более близким ко мне генетическим расстоянием (по Y-DNA matches на ФТДНА) вдруг оказываются на других ветках по филогении является нормальной?
Кроме этого "личного замечания" есть и более глобальное явление, наблюдаемое при построении дерева гаплогруппы Q1b. Гаплотипы с подтвержденными снипами ложатся стабильно и относительно ровно на отдельные ветви. Что касается кластеров, сформированных по двум маркерам (DYS385, DYF395S1), то при филогении часть кластеров "рассыпается"...

Это нормально.
Y-STR филогения всегда носит гадательный характер.

Самое большое разочарование 2011 года:(
Понятно, что научное знание всегда относительно. Понятно, что если ты думаешь, что что-то понял, значит, ты что-то упустил. Но всё равно обидно. Такая была красивая теория и только забрезжила на горизонте перспектива что-нибудь понять.

Если серьёзно - могут ли уважаемые корифеи МолГена дать некий алгоритм работы по приведению Y-STR дерева в более стабильное состояние? Или вывод о бесперспективности Y-STR филогении уже сделан, но ещё просто не осознан "широкими массами"?

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Некоторые проблемы STR-филогении
« Ответ #10 : 07 Июль 2011, 13:31:45 »
Гадательность не означает бесперспективности, отнюдь.
К слову, большинство математических реконструкций прошлого (в том числе симуляции, ретроспекции генеалогии гаплогрупп по современным гаплотипам и т.д.) всегда оперируют понятием вероятности.
Просто об этом нужно всегда помнить и честно говорить.
Именно это отличает науку от шарлатанства.

Оффлайн kaa76

  • Сообщений: 631
  • Страна: ru
  • Рейтинг +214/-0
  • Y-ДНК: R-L1029
  • мтДНК: U5a2a2
Re: Некоторые проблемы STR-филогении
« Ответ #11 : 07 Июль 2011, 14:05:51 »
Самое большое разочарование 2011 года:(
Понятно, что научное знание всегда относительно. Понятно, что если ты думаешь, что что-то понял, значит, ты что-то упустил. Но всё равно обидно. Такая была красивая теория и только забрезжила на горизонте перспектива что-нибудь понять.

Если серьёзно - могут ли уважаемые корифеи МолГена дать некий алгоритм работы по приведению Y-STR дерева в более стабильное состояние? Или вывод о бесперспективности Y-STR филогении уже сделан, но ещё просто не осознан "широкими массами"?

Для меня это недавно тоже было шоком, когда уважаемый Овод мне написал в своем разделе, что деревья и реальность часто не совпадают.

 :o - А куда делся его раздел?? Хотел ссылку дать...

Оффлайн Yurgan

  • Кто везёт, тому везёт
  • ...
  • Сообщений: 8423
  • Страна: ar
  • Рейтинг +945/-8
  • Потомок кузнеца Ильмаринена
    • Сибирский родословец
Re: Некоторые проблемы STR-филогении
« Ответ #12 : 07 Июль 2011, 14:35:45 »
Самое большое разочарование 2011 года:(
Понятно, что научное знание всегда относительно. Понятно, что если ты думаешь, что что-то понял, значит, ты что-то упустил. Но всё равно обидно. Такая была красивая теория и только забрезжила на горизонте перспектива что-нибудь понять.

Если серьёзно - могут ли уважаемые корифеи МолГена дать некий алгоритм работы по приведению Y-STR дерева в более стабильное состояние? Или вывод о бесперспективности Y-STR филогении уже сделан, но ещё просто не осознан "широкими массами"?

Для меня это недавно тоже было шоком, когда уважаемый Овод мне написал в своем разделе, что деревья и реальность часто не совпадают.

 :o - А куда делся его раздел?? Хотел ссылку дать...
Не волнуйтесь, лет через десять откроют массу снипов, и гадать будем намного меньше.
Если два гаплотип оказываются на расстоянии менее 10 мутаций, то люди наверняка родственники и из одного кластера. Проблема только в тех гаплотипах, которые одинаково далеки ото всех, но это всего лишь проблема времени, будут новые гаплотипы, все изменится.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Некоторые проблемы STR-филогении
« Ответ #13 : 07 Июль 2011, 14:40:34 »
Если два гаплотип оказываются на расстоянии менее 10 мутаций, то люди наверняка родственники и из одного кластера. Проблема только в тех гаплотипах, которые одинаково далеки ото всех, но это всего лишь проблема времени, будут новые гаплотипы, все изменится.

Без снипов структура Y-STR будет менятся каждый раз, с добавлением новых гаплотипов.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Некоторые проблемы STR-филогении
« Ответ #14 : 07 Июль 2011, 15:14:39 »

Не волнуйтесь, лет через десять откроют массу снипов, и гадать будем намного меньше.
Если два гаплотип оказываются на расстоянии менее 10 мутаций, то люди наверняка родственники и из одного кластера. Проблема только в тех гаплотипах, которые одинаково далеки ото всех, но это всего лишь проблема времени, будут новые гаплотипы, все изменится.

Понятно. Поэтому то уважаемый Wertner со своим роботом сейчас усиленно налегают на снипы! Буду учитывать снипы при построении дерева (в принципе я это уже начал делать, но глубоко проснипованных Q1b пока мало...)

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.