АвторТема: Построение дендограмм (графиков, схем, деревьев) гаплогруппы  (Прочитано 54244 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
1. Не въезжаю в слово "укоренение". По-видимому, это про использовании в таблице для Филипа либо модального гаплотипа, как было в первой таблице, либо его нужно стереть и в первую строку вставить гаплотип из выборки?
В качестве базового (предкового) гаплотипа мы в вышеуказанных примерах используем модальный гаплотип.
А в принципе, можем использовать любой из 7 гаплотипов. Т.е., рассматриваются гипотезы, когда один гаплотип остался неизменным (т.е. совпадает с предковым), а остальные - последствия накопленных мутаций.
Даю Вам образчики укоренений:

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
3. Модальный гаплотип формируется утилитой. Как его подправить "со стороны"?
Смотрим ниже приложенную картинку. Что мы видим?
Напротив DYS439 три раза 11, три раза 10, один раз 9.
В качестве модального значения взято макисмальное, т.е. 11. А можно с равным успехом взять 10.
Для этого вручную изменяете значение маркера. Помещаете все гаплотипы (вместе с модальным) в исходное окно. Снимаете галочку в окошке Создать модальный гаплотип.

Говорю сразу, в данном случае счастья Вам это не прибавит.

:)

Можете взять любое иное значение в качестве модального. Например отснипованный модал для R1a. И опять же получите сходную топологию для ветвей, а TMRCA - для модала другое.
Это то, что Клесов именует причесыванием (избегая подробного объяснения, дабы не казаться слишком уж простым).

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
2. Как сделать укоренение "по наличию мутаций вообще" и как по "одношаговым мутациям"?
В утилите Вы можете выбрать опцию генетических дистанций. (См. приложенный снимок.)
По умолчанию используются мутации вообще.
Кликнув на Гибридную модель, в нашем случае получим чистую одношаговую модель. Так как два маркера, по которым в гибридной модели используются бесконечные аллели, у нас не тестированны.

Напомню, филип всегда делает расчет по одношаговой модели. Так что Вам вовсе не обязательно заморачиваться с разными используемыми способами определения генетических разниц.
« Последнее редактирование: 08 Сентябрь 2009, 21:10:21 от Mich Glitch »

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Образец отчета.
« Ответ #93 : 08 Сентябрь 2009, 21:09:35 »
Как бы я писал отчет для своих однофамильцев?

Поместив бы результаты (гаплотипы) и построение по бесконечной модели от модала, я бы сказал, когда имел место общий предок для всей группы.
Посокрушавшись о том, что далеко, дал бы просчеты TMRCA для ветвей.
А затем получив приближенцев по каждому гаплотипу из базы российских гаплотипов и Ysearch, сделал бы построение по десятку самых близких приближенцев для каждого гаплотипа и дал бы (по моей методе) расчет TMRCA. Если выплывут совпаденцы, то в первую очередь уведомил о них.

Вот как-то так.

:)

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Кластерная схема
« Ответ #94 : 08 Сентябрь 2009, 21:17:38 »
Даю Вам ещё кластерную схему:

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Помещаете все гаплотипы (вместе с модальным) в исходное окно. Снимаете галочку в окошке Создать модальный гаплотип.
Можете взять любое иное значение в качестве модального. Например отснипованный модал для R1a. И опять же получите сходную топологию для ветвей
Ну, вот это,похоже, самое главное. Так понял, "модальным" будет тот гаплотип, который стоит в первой строке Филипового окна, при снятой галочке? Это и называется укоренение?

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Ну, вот это,похоже, самое главное. Так понял, "модальным" будет тот гаплотип, который стоит в первой строке Филипового окна, при снятой галочке? Это и называется укоренение?
Ещё раз смотрим картинку:

Модальным гаплотипом называется синтетический гаплотип с наиболее часто встречающимися значениями по каждому маркеру.
По умолчанию укоренение производится от первого гаплотипа, стоящего в сгенерированном для филипа файла.
Мы можем выбрать опцию создания модального файла (она действует по умолчанию). А можем обойтись без неё.
Для укоренения можно поставить нужный гаплотип в первую строчку. А можно просто изменить корень на уже готовом построении (опция Place root on branch в левом столбике пиктограмм Меги).

Конечно же это - не самое главное. Так как результаты выделяемых ветвей почти совпадают. А при наметанном глазе - они (родственные ветви) видны сразу.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Укоренение
« Ответ #97 : 08 Сентябрь 2009, 22:00:58 »
Смотрим кластерную схему:

Мы можем произвольно в качестве предкового взять любой из реальных гаплотипов. Несмотря на разную вероятностную оценку для каждого из случаев, все они могут иметь место быть.

А можем попытаться сгенерировать некое среднее значение, соответствующее средним сегментам. Но не факт, что именно оно и соответствует предковому.

Более того, при добавлении новых гаплотипов, топология запросто поплывет.

Что делать?

Ответ (практического плана) прост:
1) Родственные ветви выявляются и так.
2) Увеличение числа анализируемых маркеров; уменьшение допустимых генетических дистанций; общее увеличение рассматриваемых сэмплов - всё это прибавляет однозначности толкования.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Для укоренения можно поставить нужный гаплотип в первую строчку. А можно просто изменить корень на уже готовом построении (опция Place root on branch в левом столбике пиктограмм Меги).
Опция Place root on branch производит впечатление. В Вашем наборе картинок с различными укоренениями есть пара чудесных картинок с кучкующейся тройкой 8127-5955-6312 (включая кластерную схему Radiation). Сколько я ни щёлкал на опцию, перед 6312 всё время вклинивается 1845. Подскажите уж, как добиться. например, картинки №4? Это было бы то, что нужно...
А, нет, вот что-то получил: вставил на место модального - 17-м-предковый из статьи А. Клёсова "9 племён". Тут и "тройка" рядом и даже 0667-4764 рядом. Вроде оно?
« Последнее редактирование: 08 Сентябрь 2009, 23:40:20 от Alexander »

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Александр,
Сформулируйте четко вопросы, на которые Вы ищете ответы, выполняя построения.
Я думал речь идёт об определении родственных групп из небольшой выборки в семь сэмплов.
Кроме того, предложил Вам найти приближенцев по каждому гаплотипу в открытых базах, а если повезет, то и совпаденцев.
Ну, и наконец можно было бы просчитать времена, как для выборки, так для ее ветвей и для данных из сторонних баз.

Вас, вижу, интересует совсем другое. Что, мне не понятно.

Составьте табличку генетических дистанций (как по бесконечной модели, так и по одношаговой) для семи Ваших гаплотипов, плюс клесовский из статьи.
Потом просуммируйте все генетические дистанции по каждому из гаплотипов, включая клесовский.
Это Вам даст ответ на вопрос то, или не то.

Если ответ не убедит, предоставьте обе таблички и я дам свое толкование.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Сформулируйте четко вопросы, на которые Вы ищете ответы, выполняя построения.
Я думал речь идёт об определении родственных групп из небольшой выборки в семь сэмплов.
Кроме того, предложил Вам найти приближенцев по каждому гаплотипу в открытых базах, а если повезет, то и совпаденцев.
Ну, и наконец можно было бы просчитать времена, как для выборки, так для ее ветвей и для данных из сторонних баз.
Вас, вижу, интересует совсем другое. Что, мне не понятно.
Извиняюсь, действительно уклонился от темы.
Речь идёт об определении родственных групп внутри семёрки (и даже не столько о конкретной выборки, как об освоении методики определения, так как наша группировка ещё не вся выложена и могут добавиться ещё R1a1). В открытых базах ещё не искал. Знаю только, что на ветке "однофамильцев" шёл разговор о многочисленных совпаденцах и пошаговиках 17-м-R1a1. Попробую, может, поискать сначала среди них. Методику расчёта времен с Вашей помощью, как мне кажется, усвоил. Вечером попробую самостоятельно рассчитать время для группы 8127-5955-1845-6312.
Тема генеалогии затягивает, как в омут, но настолько незнакома, что без помощи и водительства не обойтись. не обессудьте, если в некоторых местах я проявляю полное непонимание. Надеюсь, это дело времени (которого, как водится, катастрофически не хватает...)

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Александр, Вы не представили табличку генетических разниц для Вашей семерки вкупе с материалом из статьи Клесова.

Ну. да ладно.

Простая аналогия.
Представьте, что у Вас на географической карте находится 7 точек, соответствующей 7 путешественникам. Предполагается, что все они вышли из одной точки. Мы пытаемся установить из какой именно и когда. Используем разные концепты (например, перемещения вообще, или же по однодневному переходу).

Так вот модальный гаплотип в этой аллегории соответствует наикратчайшей точке.

А в принципе, наши вояжеры могли идти с любого направления и любой точки.

В использовании предкового гаплотипа, полученного АК есть своя логика, если он соответствует снипованным R1а данным.
Но какое он имеет касательство к группе однофамильцев?
Самое опосредственное.

Логичнее (повторюсь в третий раз, потому как никакого отклика от Вас на предложение не услышал - возможно Вы его просто не поняли  ??? ) взять собрать по десятку приближенцев из открытых баз для каждого гаплотипа; добавить туда гаплотипы из семерки и выполнить построения для каждого из тестируемых. Вместе с расчетами времен, всё это займет часа три.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Логичнее (повторюсь в третий раз, потому как никакого отклика от Вас на предложение не услышал - возможно Вы его просто не поняли  ??? ) взять собрать по десятку приближенцев из открытых баз для каждого гаплотипа; добавить туда гаплотипы из семерки и выполнить построения для каждого из тестируемых. Вместе с расчетами времен, всё это займет часа три.
Обязательно это сделаю. Сейчас не всегда есть доступ к Интернету-компу, ограничено, постараюсь в понедельник может...

Пока вот, попытался сделать самостоятельный расчет времен и, конечно, сразу упёрся.

Расчёта времени до предка для ветки из 4-х гаплотипов (из 7 всего).
Таблица попарных гендистанций для четвёрки прикреплена.
Расчёт усложнился (или упростился?) тем, что для семёрки время до предка уже рассчитано: медианное значение 7, диапазон времён 3780-4200 лет. Стало быть, любой результат внутри группы из 7 сэмплов не должен выбиваться из расчётных границ.

Для облегчения сделал таблицу времён под 17 маркеров, скорость 0,0021 (округлены до 10 лет):
Ген.разница   0   1   2   3   4   5   6   7   8   9
Макс.пик. Вероятности%   3,507   1,274   0,907   0,725   0,609   0,525   0,46   0,406   0,361   0,321
Перех.событий   1   29   60   93   128   165   207   252   302   360
Возраст по пик.вер.   нет   440   900   1400   1920   2480   3100   3780   4530   5400
Перех.событий при кум.вер=0,5   19   48   79   113   149   188   231   278   330   388
Возраст по кум.вер.=0,5   290   720   1190   1700   2240   2820   3470   4200   4950   5820

Вот ген.разницы для четвёрки SX8127-SF5955-SG6312-SF1845: 2-3-3-5-6-7
Сэмплов чётное число, медианное значение отсутствует? Или можно выбрать между 3 и 5? Или взять среднее=4? Подождём с ответом и просмотрим тройки сэмплов внутри этой четвёрки.
Варианты: 8127-5955-6312: 2-3-3        медианное 3, среднее 3
                   8127-5955-1845: 2-5-7        медианное 5, среднее 5
                   8127-6312-1845: 3-5-6        медианное 5, среднее 5
                   5955-6312-1845: 3-6-7        медианное 6, среднее 5
По всей видимости, время до общего предка 4-х должно совпадать с максимальным временем в выборках из трёх сэмплов. По виду этих выборок, самый старый предок у 1845. Но для выборок с этим сэмплом медианные разные: 5-5 и 6. А нужно бы что-то одно. Выбрать по максимуму=6? Попробуем так, но далее проверим, как выглядит такой приём на серии выборок для самого старого гаплотипа из 7: SH5315.
Перебор вариантов троек, в которые входит 5315 даёт всего 15 вариантов. В 13 из них медианное 7 (как в общем расчёте). Но для 2-х вариантов, получается медианное 8:
5315-0667-1845 (6-8-9) и 5315-0667-8127 (7-8-8). Если взять 7, то расчёт укладывается в логику. Если взять 8, то по нашей табличке время (по пик.вер) будет 4530 лет (по кум.вер – ещё больше) и не вписывается в границы семёрки.
    Похоже, слишком малые выборки дают не всегда удобные результаты.
Вопрос: как считать время до предка в микровыборке, если её медианное значение превышает медианное общей группы? А также, если в серии микровыборок с дальним предком медианные значения разнятся?
« Последнее редактирование: 17 Февраль 2010, 11:52:31 от Alexander »

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Александр,
Для начала Вам от меня плюс за вдумчивость, внимательность рассмотрения и упорство!
Теперь по порядку.

Расчёта времени до предка для ветки из 4-х гаплотипов (из 7 всего).
Таблица попарных гендистанций для четвёрки прикреплена.
Расчёт усложнился (или упростился?) тем, что для семёрки время до предка уже рассчитано: медианное значение 7, диапазон времён 3780-4200 лет. Стало быть, любой результат внутри группы из 7 сэмплов не должен выбиваться из расчётных границ.

Нет. Не так. Попарные разницы наверняка превышают значение полученное для группы. Исходя из определения медианы, в пределе 50% попарных разниц меньше полученного значения и 50% больше.
Такая же ситуация может быть и в группах.
Отвечу на другие вопросы и вернемся к физическому смыслу этого казалось бы парадокса.
:)
« Последнее редактирование: 10 Сентябрь 2009, 18:33:44 от Mich Glitch »

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Теперь по поводу медианы в случае четного количества сортируемых значений.
Википедия в определении медианы для данного случая говорит следующее:
Цитировать
For an even number of values
As an example of this scenario, we will calculate the median of the following population of numbers: 1, 5, 2, 10, 8, 7.

Again, start by sorting the numbers: 1, 2, 5, 7, 8, 10.

In this case, both 5 and 7, and all numbers between 5 and 7 are medians of the data points.

Sometimes one takes the average of the two median numbers to get a unique value ((5 + 7)/2 = 12/2 = 6).
Т. е. 5 и 7, а также все числа между ними - являются медианными.
Иногда берется среднее значение.

Воспользуемся средним значением из 2-3-3-5-6-7 в качестве медианного и мы. Т.е. возьмём 4.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.