АвторТема: Построение дендограмм (графиков, схем, деревьев) гаплогруппы  (Прочитано 54256 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн zastrug

  • ...
  • Сообщений: 11270
  • Страна: ru
  • Рейтинг +2849/-49
  • I2b1c (P78+)=I2a2a1b1a= I2a1b1a2a1a1( I-FT413656)
  • Y-ДНК: I2b1c
  • мтДНК: T2a1a
Спасибо авторам темы за подробные объяснения.
P.S. Плюсики какие-нибудь бы? А то и не поблагодарить нельзя и флуд в теме получается

Оффлайн Grigoriev

  • Администратор
  • *****
  • Сообщений: 3098
  • Страна: ru
  • Рейтинг +187/-3
    • Молекулярная генеалогия
  • Y-ДНК: O3a3c
  • мтДНК: J1c
Сделано!
Спасибо за замечание. Если будут еще - пишите свои замечания и предложения в тему Новый форум МолГена: вопросы и ответы

Оффлайн napobo3

  • Сообщений: 1257
  • Страна: il
  • Рейтинг +348/-2
  • Y-ДНК: J-FGC5231
  • мтДНК: N1b2
Спасибо за подробное объяснение! Хочу добавить, что вместо выделения данных в таблице Ysearch я использую автоматические средства - скрипт Теда Канделя, позволяющий сохранить содержание таблицы в .ych файл. Меньше мороки и нет риска ошибок - типа рука дрогнула при выделении/копировании.

Оффлайн shekhol

  • Сообщений: 744
  • Страна: fr
  • Рейтинг +145/-12

Переменные скорости мутаций последний раз калибровались в 2003 году. Да и то не на слишком большом количестве данных.
Я использую постоянную скорость мутаций для 17, 25, 37 и 67 маркерных гаплотипов. 12-маркерными гаплотипами, в силу их непригодности для генеалогических нужд, не занимаюсь вовсе.
Так вот, использую скорость 0.002 мутация / (поколение* маркер).
Увеличение, или уменьшение скорости мутаций на топологии никак не отражается. А что до расчета времени до общего предка, так оно носит приблизительный характер.


Откуда взялась эта скорость в такой форме (деленный на маркер) ? 
Действительно ли скорость мутации, посчитанная на разном количестве маркеров, одинаковая? Или это небольшое упрощение?
 

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
CРЕДНИЕ скорости мутации маркеров в разноразмерных гаплотипах (о которых здесь, очевидно, идет речь) могут существенно различаться - в 1.5 - 2 раза. А для нестандартных наборов маркеров - в разы. Кроме того, любой набор маркеров должен калиброваться по известным родословным - для повышения точности, так как простое усреднение ненадёжно в плане очень большой ошибки в определении индивиальных скоростей мутации маркеров в парах отец-сын, особенно для медленных маркеров.

Что же до топологии дерева, то она не зависит от скоростей только для равных весов каждого из маркеров при его построении. На самом же деле они все различны и программа парсимонии при построении дерева с весами маркеров будет стремиться объединить в общие ветви прежде всего самые медленные маркеры, что критическим образом повлияет на его топологию.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Откуда взялась эта скорость в такой форме (деленный на маркер) ?
Допустим мы исследуем 17-маркерный гаплотип на глубину 10 поколений.
Имеем 17 маркеров * 10 поколений * 0.002 мутация/(маркер*поколение) = 0.34 мутации.
Т.е. речь идет о размерности. А смысл таков: за 10 поколений на 17 маркерном гаплотипе в среднем проскочит 0.34 мутации.

Действительно ли скорость мутации, посчитанная на разном количестве маркеров, одинаковая? Или это небольшое упрощение?
Конечно же нет.
Скорость для каждого из отдельных локусов - вариабельна.
Более того, представляется логичным, что и в пределах одного маркера скорость изменяется от многих причин. Т.е. я могу допустить, что скорость мутаций DYS390 у, скажем, полинезийцев не такая как у норвежцев. Возможно на неё оказывают влияние общий радиационный фон местности. Возможно есть зависимость от солнечной активности, от традиционного рациона питания и пр., пр.

Проверить все это (т.е. выверить с точностью) невозможно.

Поэтому проще использовать усредненную скорость хоть как-то откалиброванную на основе реальных генеалогий.


Оффлайн shekhol

  • Сообщений: 744
  • Страна: fr
  • Рейтинг +145/-12
Спасибо за оперативный ответ.

Тогда еще вопросы.
13 поколений я своих документально знаю, какую пользу из этого можно извлечь для остальных однофамильцев с полученными маркерами.


И вот, например, у двоих получились такие результаты:
13 32 25 15 15 11 15 15 14 11 20 13 11 11 13 10 24  
13 31 25 15 15 12 15 16 14 12 20 12 11 11 13 10 24 

Отличия только на единицу в 5-ти локусах. Почему отличия в 2-3 локуса - дальние родственники, а в 5  - нет.

 

« Последнее редактирование: 30 Апрель 2009, 17:31:49 от shekhol »

Оффлайн shekhol

  • Сообщений: 744
  • Страна: fr
  • Рейтинг +145/-12
Еще вопрос.  Есть ли зависимость этой скорости мутации от времени?
Сейчас мутации происходят быстрее, чем в средние века? (с учетом допущения, что продолжительность жизни не менялась)
« Последнее редактирование: 30 Апрель 2009, 17:32:05 от shekhol »

Оффлайн shekhol

  • Сообщений: 744
  • Страна: fr
  • Рейтинг +145/-12
Какие по максимуму могут быть раличия в локусах между мной и четвероюродным дядей, у которого предки переселились из Центрально-Черноземного района на дальний север? :)

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Откуда взялась эта скорость в такой форме (деленный на маркер) ? 


Судя по тому что Ваше любопытство не было удовлетворено ответами, рискну предположить что вопрос был еще проще и формальнее: зачем делить? Здесь имеется в виду некая постоянная средняя скорость мутирования локуса, но поскольку вероятность хотя бы одной мутации в множестве локусов тем больше чем больше их число, просто производят умножение этой скорости на число локусов. Выше еще было сказано, что есть нестандартные наборы локусов, для которых реальная средняя скорость отличается от предложенной.
« Последнее редактирование: 30 Апрель 2009, 17:49:14 от Valery »

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
13 поколений я своих документально знаю, какую пользу из этого можно извлечь для остальных однофамильцев с полученными маркерами.
Для калибровки необходимы как минимум два человека с пересекающейся выверенной родословной.
То есть можно взять пару отец-сын (один генетический переход).
Можно взять двух братьев (два поколенных перехода, или одно поколение). Хорошо бы взять деда с внуком, или разыскать правнука из прадедом.
Глубже не получится. Люди имеют особенность умирать.
Значит надо брать удаленных кузенов.

Пример.
Протестировали Вас и Вашего троюродного брата по 67 маркерам. Т.е. двух человек имеющих общего предка три поколения назад. (Именно поколений, а не поколенных переходов. На родстве.ру, например, лихо заменяют одно на другое.)
Допустим имеем для этой пары кузенов 66/67.
Значит скорость мутаций в этом конкретном случае 1 мутация / 67 маркеров / 3 поколения = 0.004975.

А с другим Вашим троюродным братом вообще полное совпадение. Значит скорость мутаций 0 / 67 / 3 = 0.

По результатом же двух случаев имеем сл. цифирь:

(0 + 0.004975) / 2 = 0.002487

Чем больше данных, тем точнее значение.

Я разграничиваю две задачи:
1) Реконструкция топологии (т.е. разбираемся с тем, кто от кого произошел и каким образом).
2) Расчет времени до общего предка.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Откуда взялась эта скорость в такой форме (деленный на маркер) ? 


Судя по тому что Ваше любопытство не было удовлетворено ответами, рискну предположить что вопрос был еще проще и формальнее: зачем делить? Здесь имеется в виду некая постоянная средняя скорость мутирования локуса, но поскольку вероятность хотя бы одной мутации в множестве локусов тем больше чем больше их число, просто производят умножение этой скорости на число локусов. Выше еще было сказано, что есть нестандартные наборы локусов, для которых реальная средняя скорость отличается от предложенной.
Понятно, что можно использовать постоянную скорость на гаплотип одной длины.
Но если речь не идет о создании собственного инструментария (пример, уважаемый Valery, разрабатывающий Мурку), а об использовании уже имеющихся программ, то они по большей части используют помаркерную скорость мутаций.
Если же кто-то использует всегда стандартный 67-маркерный гаплотип, то думаю ему не составит труда умножить 0.002 на 67  и пользовать скорость мутаций 0.135 мутация / поколение.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Нам бы лучше перебраться в ветку Расчет времени до общего предка
А здесь (в этой ветке) хотелось бы оставить набор практических рекомендаций для людей желающих заняться рисованием.
:)

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Я разграничиваю две задачи:
1) Реконструкция топологии (т.е. разбираемся с тем, кто от кого произошел и каким образом).
2) Расчет времени до общего предка.


Конечно это совершенно разные задачи. Некоторую трудность составляет тот факт, что зачастую вторую задачу пытаются увязывать с первой, а именно, вычисляют возраст исходя из того или иного уже полученного набора деревьев. Другие делают иначе, считая каким-то совсем нефилогенетическим способом число мутаций в выборке и затем корректируют его используя собственные теоретические представления о 1) структуре популяции и дрейфе в ней и о 2) возвратных мутациях.

Забавно когда берут филогенетическое дерево и затем делают обычную поправку на возвратные мутации. Дело в том что филогенетические деревья сами по себе реконструируют немало таких мутаций и поэтому их использование в расчетах требует НОВОЙ калибровки скорости привязанной к ДАННОМУ методу построения деревьев.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Забавно когда берут филогенетическое дерево и затем делают обычную поправку на возвратные мутации. Дело в том что филогенетические деревья сами по себе реконструируют немало таких мутаций и поэтому их использование в расчетах требует НОВОЙ калибровки скорости привязанной к ДАННОМУ методу построения деревьев.
Полностью с Вами согласен!
Я об этом тоже бубнил на старом форуме. Правда не в таких вежливых выражениях.
:)

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.