АвторТема: Построение дендограмм (графиков, схем, деревьев) гаплогруппы  (Прочитано 54247 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a

По виду этих выборок, самый старый предок у 1845.
Неправильная фраза!
Возьмем опять географию (в принципе, - тоже разновидность топологии).
Допустим имеем несколько точек на географической карте. Поставлена задача: найти географический центр тяжести. Т.е. такое место, общая сумма расстояний в котором до всех точек будет минимальна. Так вот, центр будет один, а расстояния до каждой из точек - разные.

Так и в нашем случае. Мы имеем одного общего предка. В этом и состоит задача. А вот расстояния до этого предка, т. е. генетические дистанции, вытекающие из количества и значений (в случае топологии или одношаговой модели) мутаций, - могут быть разными.

Т.е. то, что 1845 отстоит на шесть разниц от модала группы означает наличие маловероятных (точнее, менее вероятных) событий. По-простому, количество мутаций и их характер у 1845 превзошли среднегрупповое.
« Последнее редактирование: 10 Сентябрь 2009, 18:35:11 от Mich Glitch »

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Итак, общий предок для группы из 4 сэмплов.
Медианное значение 4.
Воспользовавшись Ваше табличкой, получаем временной интервал для общего предка: 1920-2240 лет тому назад.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
...предложил Вам найти приближенцев по каждому гаплотипу в открытых базах, а если повезет, то и совпаденцев.
Ну, и наконец можно было бы просчитать времена, как для выборки, так для ее ветвей и для данных из сторонних баз.
На первый раз обратился к таблице статуса образцов на Генофонде.ру, благо там все 17-маркерные. Искал по РАЗНОСТИ, не более 3, редко 4-5 шагов. После 42 штук поплыл и решил остановиться.
     Надеюсь, раз ссылку я дал, то права Генофонда как бы соблюдены... Конечно, по-хорошему нужно бы набить оттуда всех R1a. Надеюсь, найдутся, кто это сделает. У меня только приближенцы к нашей семёрке, и то далеко не все, будет время добью. В основном, близкие к SX8127-SF5955-SG6312-SF1845 (более 10 приближенцев для каждого). Для тройки SZ4764-SJ0667-SH5315 мало чего нашёл, поэтому она выделилась в отдельную ветку, которая плохо проработана.
     Похоже, в кластере - пара больших ветвей. В первой сидят 8127 и 5955. Во второй - все остальные. Чёткая подветка для 1845. 6312 как-то затерялся в листве.
     Что дальше? Наверное нужно попробовать построить отделно первую ветку? или подветки 8127-5955? Потом времена... Родственников, кажется, не предвидится. Или поискать ещё гаплотипов?

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Подветка для 1845, можно сказать есть. Но всё-равно (в плане родичей) остался он стоять особняком.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
На вопрос, что дальше?, я бы еще поискал приближенцев.

Как-то все члены Вашей Великолепной семерки торчат себе одиноко.

Вот что хотел спросить, Вы с вводом значений маркеров ничего не напутали? А то такая непохожесть для всей группы вызывает какие-то смутные подозрения.

 :)

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
На вопрос, что дальше?, я бы еще поискал приближенцев.Как-то все члены Вашей Великолепной семерки торчат себе одиноко.Вот что хотел спросить, Вы с вводом значений маркеров ничего не напутали? А то такая непохожесть для всей группы вызывает какие-то смутные подозрения.
Своих сейчас, вроде, проверил, всё, как и раньше. Остальных уже вряд ли проверишь. Но по общему виду - тоже вроде нормально.
Попробую переделать таблицу, которую использовал для поиска (эксель), чтобы вставлять сразу всю страницу Генофонда, производительность поиска должна увеличиться. Но это уже на следующей неделе. Уезжаю на сбор урожая...

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Для проверки верности предсказания группы (у семёрки R1a) решил построить общее дерево для всего клана Киреевых (18 выложенных из 26 сдававших). Как раз R1a выделились в чётко отдельную ветку. Все остальные сидят на второй ветке, в которой полный разброд и шатания. Неплохо выглядит только R1b - пара на своей веточке.
N разнеслись вообще в разные стороны. Хотя эксперты-северяне подтвердили предсказание и сошлись на N1c.
Древнеевропейцы (I) проникли, кто-куда. Хотя я их проверил даже по предиктору Кена Нордтведта: SK6504 даёт c 70% вероятностью субклад I2a2 – популяция Din-N (это Dinaric-North).
SB3711 чисто I1-мутация 253-ASgen-43% (это AngloSaxonGeneric – характерный англо-саксонский тип, самый распространённый).
SM8841- субклад I1d - мутация L22-uN1=30% либо L22-uN2=30%.  (uN1-2 означает Ultra-Norse Type 1-2 или ультра-скандинавский тип 1-2 с пиком в Норвегии).
Ко мне (J2b2) в пару попал редкий клад (H). И хорошо хоть раритет (Т) сидит на отдельном ответвлении.
Тут выручат только СНИПы, когда их сделает лаборатория. Интересно будет посмотреть, кто больше прав: дендрограмма или предсказатель Аттея?
(Вероятности предсказания указаны для случаев меньше 100%)

Оффлайн CenturionАвтор темы

  • 100% Earth (Solar System) genofond
  • Администратор
  • *****
  • Сообщений: 9548
  • Страна: ru
  • Рейтинг +571/-2
Т и Н конечно экзогруппы для россиян. Тут может быть ошибка в предсказание. Пока на 17 он показывает одно, а если бы было больше локусов возможно указал бы более "реальную" гаплогруппу. Кажется это предиктор не очень точен, когда дело касается не типичных гаплотипов.

Оффлайн mouglley

  • ...
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
То есть, пока, мы видим, что для Большой России Y-filer - пустышка.

Гаплогруппы сводятся через пень-колоду, а не через дерево Y-хромосом.

Оффлайн CenturionАвтор темы

  • 100% Earth (Solar System) genofond
  • Администратор
  • *****
  • Сообщений: 9548
  • Страна: ru
  • Рейтинг +571/-2
Ай-яй-яй Маугли...  :(

Оффлайн mouglley

  • ...
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Ну, такой я, прямой... В некоторых местах, однако.
Ни разу не вижу пользы Y-filer'а в N.

Понимаете, какой это напряг для меня не смочь разделить гаплогруппы N1b и N1c?

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Ну вот, выбрал всех приближенцев R1a (1-3 шага) из "однофамильцев" (57+7 моих=64 гаплотипа). Увы, пока бесперспективно. Хотя у SX8127 остался его напарник SD2834 Шмаков - пошаговик (на DYS393). Пара выглядит неплохо. Кажущиеся соседи SJ0667-SI8435Саксонов и SH5315-SW2339Таранов на самом деле далеки (5 шагов и 3 шага). У них дефицит приближенцев. Остальные 4 наших явных соседей не имеют.
Стало быть пора переходить на поиск в базах. Нужно было бы сразу, но может быть этот кластер пригодится кому-нибудь из участников проекта. Есть очень перспективные группочки.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
То есть, пока, мы видим, что для Большой России Y-filer - пустышка.
Гаплогруппы сводятся через пень-колоду, а не через дерево Y-хромосом.
А может быть Мурка сведёт через дерево Y-хромосом? Увы пока я не вижу даже откуда к ней подступиться... Где бы внятную (пошаговую) инструкцию почитать?

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
То есть, пока, мы видим, что для Большой России Y-filer - пустышка.
Гаплогруппы сводятся через пень-колоду, а не через дерево Y-хромосом.
А может быть Мурка сведёт через дерево Y-хромосом? Увы пока я не вижу даже откуда к ней подступиться... Где бы внятную (пошаговую) инструкцию почитать?

на 17 локусах не сведет, увы :(

Кстати, кластеризация по гаплогруппам на данных "Родственников или Однофамильцев" должна быть лучше чем на произвольных выборках по России, по той простой причине что среди однофамильцев находятся кластеры близких родственников. Но правильно свести воедино эти поддеревья без снипования нельзя, даже если взять (например) только R1a: мы получим набор кластеров R1a которые свяжутся друг с другом совершенно случайным образом.

Но в то же время, если генетические расстояния между однофамильцами малы и они из одной гаплогруппы, шанс что построенное ТОЛЬКО по ним дерево правильно, будет больше. Причина заключается в том что гомоплазия (т.е. набор параллельных и обратных мутаций) за короткое время еще не успела дойти до уровня который смазывает всю картину. А на выборках которые сходятся к одному предку жившему много тысяч лет назад, этот критический уровень уже превышен и многократно.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Александр, Вам очередной плюсик за пытливость и успехи в построениях.
Замечание по представлению результатов. Не могли бы Вы, пожалуйста, конечные картинки, выкладываемые в форум делать шириной 600-800. Получается не очень мелко. И не очень крупно. С одной стороны всё читаемо. А с другой не нужно скролить.
Посмотрите соседнюю ветку (ссылка). Пытаемся разобраться, как размеры выборки влияют на топологию референтной группы. Особенно обратите внимание на приведенные картинки по 25-маркерным гаплотипам.
Ведь по сути, Вы сейчас занимаетесь тем же самым. Имеете референтную группу из 7 гаплотипов. И помимо того, что пытаетесь найти для них ближайшее окружение, можете проанализировать все изменения целиком.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.