АвторТема: Возраст монгольских N1c и их влияние на генофонд России и других стран  (Прочитано 52280 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн DimitriАвтор темы

  • Сообщений: 413
  • Страна: ru
  • Рейтинг +96/-0
  • Y-ДНК: N-Y9022>Y41021 [RU-KO] ЖМ: R1a-M458>FTB20451 [RU-BEL] МЖМ: C-M48>B80 [RU-ZAB]
  • мтДНК: HV9b1* [RU-SAR]
Есть такой вопрос - каким образом Вы получаете значения несовпадающих маркеров. Насколько я понимаю, в базе данных Соренсона при поиске совпаденцев, эти значения маркеров определить невозможно?
Да вообщем-то ничего сложного тут нет - алгоритм ручного поиска в SMGF описан в нескольких местах по сети. Идея простая: для несовпавших маркеров начинаем подбирать их значения. Сначала прибавляем к аллелю единицу, потом (если не угадали) вычитаем двойку, затем добавляем тройку и т.п. Причем делаем это сразу параллельно для всех несовпавших аллелей. Как правило, за 4-5 итераций можно извлечь полный гаплотип. Особый подход требуется к DYS464 - там могут быть дробные значения, подбирать которые может показаться довольно утомительным. Но т.к. маркеры a, b, c, d располагаются по возрастанию, то быстро (за два-три прохода) угадываем набор значений аллелей один за другим.

Самое плохое в SMGF - это ограничение числа запросов в сутки.

Оффлайн DimitriАвтор темы

  • Сообщений: 413
  • Страна: ru
  • Рейтинг +96/-0
  • Y-ДНК: N-Y9022>Y41021 [RU-KO] ЖМ: R1a-M458>FTB20451 [RU-BEL] МЖМ: C-M48>B80 [RU-ZAB]
  • мтДНК: HV9b1* [RU-SAR]
Я решил поделиться с общественностью промежуточными результатами, чтобы понять, иду ли я по правильному пути. К настоящему времени я извлек из SMGF 117 полных (43-маркерных) гаплотипов, подозреваемых в принадлежности к гаплогруппе N1c. Как я писал раньше, я не хочу их публиковать, пока не получу подтверждения, что данная выборка репрезентативна (т.е. других похожих гаплотипов в SMGF нет). Для этого мне нужно еще несколько дней, в результате чего число найденных гаплотипов возрастет. Но те, которые я уже нашел к настоящему времени, я решил прогнать через Network, используя Median Joining алгоритм с параметрами по умолчанию и с весами уважаемого wertner. Вот что у меня получилось:



Я никак не редактировал вывод Network, лишь раскрасил вершины:
  • монгольские - голубым
  • скандинавские - синим
  • российские - красным
  • прибалтийские - оранжевым
  • польские и чешские - розовым
  • немецкие - черным
  • британские - зеленым
Нераскрашенными (желтыми) остались все остальные страны. Конкретную страну можно определить по имени вершины (две первые буквы совпадают с названием национального интернет-домена).

Я вижу три кластера на этом рисунке - монгольский в центре и два преимущественно скандинавских по бокам. Как это интерпретировать, пока неясно.

Могу дать пояснения по вкраплениям вершин других цветов в монгольский кластер. Желтая вершина в центре - это Schwartz украинского происхождения. Четыре красные вершины ниже - это Gonchig (российский монгол из читы), а также люди с фамилиями Sharapov, Rodionov и Soin (последний из Якутска). Синяя вершина в нижней части монгольского кластера - это финны Lantta и Wallila.

Оффлайн mouglley

  • Модератор
  • *****
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Ну вот, теперь видна структура.
Уже можно привязывать ветки к определённым регионам.
Думаю, веса уважаемого wertner тут очень помогли.

Оффлайн shekhol

  • Сообщений: 744
  • Страна: fr
  • Рейтинг +145/-12
Замечание по графикам.

"Корень" надо отображать толстым, близкие к "корню" "стволы" - чуть потоньше, 
затем еще тоньше "ветви", ну а потом как сейчас "веточки" - шириной в 1px.

Таким образом убираются недостатки:
1. непонятно откуда растет дерево и куда (неважно что подписали "предок N" - это ненаглядно).
2. на таком дереве трудно отличать/сравнивать двоих представителей в ретроспективе.

Это ко всем наверно относится, кто рисует филогенетические деревья в пространстве ...


 

Оффлайн mouglley

  • Модератор
  • *****
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
В данной работе о определении корня речь ещё не идет.
Пока выявляется структура.

Оффлайн DimitriАвтор темы

  • Сообщений: 413
  • Страна: ru
  • Рейтинг +96/-0
  • Y-ДНК: N-Y9022>Y41021 [RU-KO] ЖМ: R1a-M458>FTB20451 [RU-BEL] МЖМ: C-M48>B80 [RU-ZAB]
  • мтДНК: HV9b1* [RU-SAR]
С корнем тут вообще неясно пока, т.к. в SMGF нет информации о снипах.
В параллельной ветке я строю дерево по 17 маркерам, там с корнем проще будет, поэтому есть надежда, что эту информацию можно будет перенести на 43-маркерное дерево (ведь они пересекаются по SMGF-гаплотипам).

Сообщаю о прогрессе в моей работе к текущему моменту: из SMGF извлечено 140 43-маркерных гаплотипа и поставлено в список для извлечения еще 24. Для каждого расшифрованного гаплотипа я просматриваю смежные с ним - в пределах 150, о которых сообщает SMGF, и проверяю, присутствуют ли они уже в моем списке. Таким образом, из SMGF извлекается облако гаплотипов, обладающее следующим метрическим свойством: между любыми двумя гаплотипами из множества извлеченных существует путь, состоящий из похожих (в пределах 70% сходства) гаплотипов. Интересно, что пока такой алгоритм не вывел меня за пределы N1c (сужу по географии -сплошная Финляндия и Монголия).

За один сеанс работы (пока не сработает ограничение на число запросов в сутки) удается извлечь 5-7 гаплотипов, т.е. мне потребуется еще 4-5 дней на завершение работы.

Оффлайн mouglley

  • Модератор
  • *****
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Адский труд.
Я сдался, не выдержал.

Оффлайн DimitriАвтор темы

  • Сообщений: 413
  • Страна: ru
  • Рейтинг +96/-0
  • Y-ДНК: N-Y9022>Y41021 [RU-KO] ЖМ: R1a-M458>FTB20451 [RU-BEL] МЖМ: C-M48>B80 [RU-ZAB]
  • мтДНК: HV9b1* [RU-SAR]
Я завершил анонсированное исследование и представляю полученные результаты.
Но сначала остановлюсь еще раз на методике: я извлек из базы Y-DNA Фонда Соренсона (www.smgf.org) выборку 43-маркерных гаплотипов, построенную следующим рекурсивным способом:
  • выборка содержат модальный гаплотип N1c (точнее, максимально похожий на него из представленных в SMGF),
  • если в SMGF имеется гаплотип, имеющий 70% и более совпадение по маркерам с одним из представленных в выборке, то он включается в выборку
Действуя в точности в соответствии с представленным алгоритмом, мне удалось извлечь из SMGF 164 гаплотипа. Я также добавил к ним три похожих (в соответствии с алгоритмом) гаплотипа из ySearch (S5HUP, Z9GMS, GRP6J). По данной выборке 167 гаплотипов было построено филогенетическое дерево (сеть) в Network методом соединения медиан (median joining) с последующим удалением неиспользуемых медианных векторов (MP option).
Сначала я попробовал использовать Network с равными весами маркеров, но результат меня не удовлетворил (сеть содержала много циклов, не было четкого разделения ветвей).
Веса уважаемого wertner помогли построить сеть с разделением на ветви, но в результате я остановился на третьем варианте (давшем лучшие результаты, чем два первых): я взял частоты мутаций из работы специалистов SMGF (откалиброванные по 8 тыс. гаплотипам) и, используя метод, описанный wertner'ом на форуме rodtsvo.ru, перевел их в веса для Network (справедливости ради замечу, что отличия от дерева с весами wertner минимальные).
В результате получилось предлагаемое вашему вниманию дерево с небольшим число циклом и с четким разделением ветвей:



Раскрашивая дерево, я старался по возможности использовать рекомендованные уважаемым moglley цвета (приводу их в десятичном формате RGB):
  • желтый yellow (255,255,0) - финны (52 гаплотипа в выборке)
  • аква aqua (0,255,255) - монголы (38)
  • зеленый lime (0,255,0) - шведы+норвежцы (14+5)
  • синий blue (0,0,255) - немцы+поляки+украинцы (6+4+2)
  • розовый pink (255,192,203) - британцы ( 8 )
  • голубой white blue (173,216,230) - литовцы (6)
  • красный red (255,0,0) - россияне (6)
Представителей остальных наций в выборке немного (26), я их оставил белыми.
Две ветви в этом дереве имеют четко выраженную национальную окраску (я их выделил).

Я также вычислил возраст этих веток в Network по ро-статистике, равно как и возраст всей выборки (из посылки, что корень древа находится в центре - где крестом расходятся четыре основные ветви - там же поблизости расположен модальный гаплотип выборки).

Монгольская ветвь имеет возраст (в мутациях) 12.3 со среднеквадратичным отклонением (сигмой) в 2.3.
Как перевести мутации в года? Я просуммировал откалиброванные частоты мутаций всех 43 маркеров, взяв данные из вышеупомянутой работы SMGF, получив 0.101 мутаций на гаплотип. Считая возраст поколения за 25 лет, я получил, что одна мутация происходит в среднем раз в 247 лет.
Получается, монгольская ветка имеет возраст примерно в 3000 лет (с 95% достоверностью плюс-минус две сигмы, т.е. 1100 лет).
Финская ветка имеет возраст в 1750 лет (плюс-минус 430 с достоверностью 95%), а всю выборку можно оценить в 3300 плюс-минус 650 лет.

Собственно, данная выборка (при всей ее условности) в очередной раз подтверждает известную гипотезу: гаплогруппа N1c зародилась где-то в степях Моноголии.

Что же касается того, сохранились ли следы монгольских завоеваний XIV в. в генофонде Европы, то вы сами можете отлично это видеть - на монгольских ветках сидят свежие (по историческим меркам) немонгольские отростки.

Хочу выслушать вашу критику, после чего готов поделиться выборкой гаплотипов с любым желающим.
« Последнее редактирование: 20 Июль 2009, 06:24:04 от Dimitri »

Оффлайн mouglley

  • Модератор
  • *****
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Превосходно и сильно.
Отлично видно карелов.
Если у Вас появится какое-то время для раскрашивания представителей остальных наций в выборке, либо объединить их по какому-то общему признаку, было бы замечательно.
Видны 5 отдельных ветвей N1c, которые пока не очень видны по коммерческим базам.

Оффлайн mouglley

  • Модератор
  • *****
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Большая вероятность, что Мурка нашла бы предка среди монголов.

Оффлайн DimitriАвтор темы

  • Сообщений: 413
  • Страна: ru
  • Рейтинг +96/-0
  • Y-ДНК: N-Y9022>Y41021 [RU-KO] ЖМ: R1a-M458>FTB20451 [RU-BEL] МЖМ: C-M48>B80 [RU-ZAB]
  • мтДНК: HV9b1* [RU-SAR]
Спасибо за отзыв, уважаемый mouglley!
Как раскрашивать оставшихся 26 гаплотипов? Среди них 14 - это американцы и канадцы, не помнящие своих европейских корней (как их красить?) Остальные - единичные представители своих наций: четверо датчан, двое китайцев, по одному венгру, голландцу, греку, киргизу, чеху, эстонцу.

Попробую освоить Мурку.

Оффлайн mouglley

  • Модератор
  • *****
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Как раскрашивать оставшихся 26 гаплотипов? Среди них 14 - это американцы и канадцы, не помнящие своих европейских корней (как их красить?)
Эти-белые бомжи.
Остальные - единичные представители своих наций: четверо датчан, двое китайцев, по одному венгру, голландцу, греку, киргизу, чеху, эстонцу.
Датчан и голландца и чеха предлагаю отнести к западным балтам - тёмносиний.
Про китайцев писал, предлагаю какой-нибудь из оттенков пурпура.
Эстонцы у меня уже значатся. Один из оттенков сине-зелёного.
Киргиз из наших - пока, до появления отдельной среднеазиатской группы - красный.
Грека сами придумайте, очень редкое явление. Интересно, от русских достался гаплотип или от турок?


Оффлайн shik

  • Сообщений: 52
  • Рейтинг +5/-0
  • Y-ДНК: N1c1*(xa,b,c)
  • мтДНК: H1
Непонятно, как обеспечивается отсутсвие примесей N1a, N1b.

Другими словами, постулируется что любой N1c отличается от любого N1b по более чем 30% маркеров. Это неочевидно. Подозреваю, что просто неверно.

Логичней было бы для включения в выборку использовать взвешенное расстояние - чтобы медленные маркеры учитывались с большим весом. И квадратичное, для учета возвратных мутаций. И даже с учётом этого отделение N1b может не получиться...



Оффлайн mouglley

  • Модератор
  • *****
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Я думаю, либо северно-западная, либо северная ветка и могут оказаться N1b.

Оффлайн Yurgan

  • Кто везёт, тому везёт
  • Модератор
  • *****
  • Сообщений: 8423
  • Страна: ar
  • Рейтинг +945/-8
  • Потомок кузнеца Ильмаринена
    • Сибирский родословец
Я думаю, либо северно-западная, либо северная ветка и могут оказаться N1b.
Работа, без сомнения, замечательная, коль скоро монголы и карело-финны сбились в разные ветви.
Но я здесь не вижу N1b - их в выборке видимо не был. А в SMGF монгольских N1b больше, чем N1c.
Дар Исиды давал гаплотипы монгольских N1b
Их надо обязательно вставить.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.