АвторТема: Кластерное сравнение 52 этнических популяций Европы, Азии, Африки и Америки  (Прочитано 8452 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Решил я взяться за этно-популяционные admixture-анализы. В качестве тренировки отработал данные из панели HGDP (Conrad et al. (2006) ) -массив данных по примерно 2800 снипам 927 индивидов из 52 популяций.

http://rosenberglab.bioinformatics.med.umich.edu/diversity.html#data5
http://rosenberglab.bioinformatics.med.umich.edu/hgdpsnpDownload.html

Данные обрабатывались в самой доступной программе анализа популяционной структуры- Structure.
Программа отработала цикл из 60 000 MCMC-запусков (40 000 до burnin, 20 000 после burnin  c интервалом "прожига" в 100 запусков), на что ушло примерно около 30 часов непрерывной работы серверного процесса. Запуск проводился при K=7 (заданное количество кластеров)

На выходе получил Q-матрицу кластерных компонентов между популяциями, а также аналогичную матрицу для всех проанализированных 927 индивидов.

Из 7 заданных кластеров, 5 кластерами была присвоена недвусмысленная генетическая аттрибуция.
Вопросы возникают лишь при интерепретации 2 и 7 кластеров (я дал им условные обозначения West-Asian и South-Asian). Но это спорно.

Визуализация матрицы в виде "пирога"

 

Оффлайн Аббат Бузони

  • ...
  • Сообщений: 19888
  • Страна: ru
  • Рейтинг +1818/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Интересно, что хазарейцев (в отличие от их соседей по индо-афганскому региону) присутствует значительный восточноазийтский "голубой" компонент.

У калашей низкая доля (древне)европейского компонента, зато (в отличие от их соседей по индо-афганскому региону) повышена доля западноазиатского компонента ("коричневый цвет"), который скорее всего частично перекрывает некое множество снипов средиземноморского происхождения.

Уйгуры -самые "европейские" (в смысле наличия у них условноевропейского компонента) из обитателей областей около Китая - как впрочем и ожидались . Меня лишь удивляет наличие в их популяции значительной примеси австролоидно-меланизийского компонента. Похоже на результат смешивания протоалтайских популяций с "австралоидами".

Оффлайн Valikhan

  • Группа N
  • *
  • Сообщений: 2193
  • Страна: kz
  • Рейтинг +102/-1
  • Ysearch 63CDM. Mitosearch EEVT3
    • Turkic World
  • Y-ДНК: N1c1d1 - L1034 (L1032, L1033)
  • мтДНК: B5a1a
Классно выглядит когда визуализировано. +

Аффтар, исчо давай!

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Вот результаты запуска Structure в виде Q-матрицы и таблицы межпопуляционных Fst.
Этот файл можно просмотреть в любом текстовом редакторе.

 

Оффлайн Valikhan

  • Группа N
  • *
  • Сообщений: 2193
  • Страна: kz
  • Рейтинг +102/-1
  • Ysearch 63CDM. Mitosearch EEVT3
    • Turkic World
  • Y-ДНК: N1c1d1 - L1034 (L1032, L1033)
  • мтДНК: B5a1a
По хазарейцам asan-kaygy статью выпускал. Это ведь остатки джучидского корпуса, бежавшего в Афганистан. В связи с этим мне ещё вспоминаются С3, О3 в некоем египетском оазисе. Это скорее всего те джучидские воины, кто бежал в Сирию и Египет.

Гаплогруппа С в целом австралоидна, на мой взгляд.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Классно выглядит когда визуализировано. +

Аффтар, исчо давай!

Я бы дал. Только вот в admixture-структурном анализе популяций с Виндой делать нечего.
Самый эфективный софт -типа ADMIXTURE, EIGENSOFT - был писан под Линух, да к тому же и с расчетом на параллелизацию компьютерных вычислений (на нескольких машинах).

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
По хазарейцам asan-kaygy статью выпускал. Это ведь остатки джучидского корпуса, бежавшего в Афганистан. В связи с этим мне ещё вспоминаются С3, О3 в некоем египетском оазисе. Это скорее всего те джучидские воины, кто бежал в Сирию и Египет.

Гаплогруппа С в целом австралоидна, на мой взгляд.

Насчет хазарейцев, да, я в курсе. Еще когда некоторые восторженые попгены носились с чингисхановским "стар-кластером", про них много писалось в прессе.

А вот насчет уйгуров, сколько у них  C?

Оффлайн Аббат Бузони

  • ...
  • Сообщений: 19888
  • Страна: ru
  • Рейтинг +1818/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!
http://scienceblogs.com/gnxp/uyger2.jpg

M9 lineage = K, L (M20), M (P256), NO (M214) (N and O), P (M45) (Q and R), S (M230) and T (M70)
M130 = C1, C2, C3, C4, C5
YAP = all E, D
M89 = G (M201), H (M52), I (M170), J (12f2.1), K
M45 = P
M173 = R1
M17 = R1a

Xue Yali et al. (2006) have tested two samples of Uyghurs, one from Urumqi and the other from Ili, and found the following distribution of Y-DNA haplogroups.

Uygur/Urumqi:
1/31 = 3.2% Y*(xA, C, DE, J, K) (This could be B, F*, G, H, or I, but, judging from other sources of Uyghur Y-DNA data, it is most likely G-M201.)
1/31 = 3.2% C*(xC1, C3) (This might be related to haplogroup C5-M356, which has been found in South Asia and Arabia.)
2/31 = 6.5% E
8/31 = 25.8% J
1/31 = 3.2% N1*-LLY22g(xN1a, N1b, N1c)
2/31 = 6.5% N1b
1/31 = 3.2% O1a
1/31 = 3.2% O3a3c*-M134(xO3a3c1-M117)
1/31 = 3.2% O3a3c1-M117
6/31 = 19.4% P*(xR1a) (This could be P*, Q, R*, R1b, or R2. I would guess that it is mostly R1b, mixed with smaller numbers of Q and R2.)
7/31 = 22.6% R1a

Uygur/Yili:
8/39 = 20.5% Y*(xA, C, DE, J, K) (This would be one of the highest frequencies of haplogroup G in the entire world if it were really all G-M201.)
1/39 = 2.6% C*(xC1, C3)
3/39 = 7.7% C3c

1/39 = 2.6% DE(xE)
5/39 = 12.8% K*(xNO, P)
1/39 = 2.6% N1*-LLY22g(xN1a, N1b, N1c)
2/39 = 5.1% N1c1
2/39 = 5.1% O3*
2/39 = 5.1% O3a3c*-M134(xO3a3c1-M117)
2/39 = 5.1% O3a3c1-M117
6/39 = 15.4% P*(xR1a)
6/39 = 15.4% R1a

Оффлайн пенелопа

  • Главный модератор
  • *****
  • Сообщений: 6485
  • Страна: ru
  • Рейтинг +2714/-13
  • мтДНК: H1b

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
.....
8/31 = 25.8% J
.....
6/31 = 19.4% P*(xR1a) (This could be P*, Q, R*, R1b, or R2. I would guess that it is mostly R1b, mixed with smaller numbers of Q and R2.)
7/31 = 22.6% R1a

Uygur/Yili:
8/39 = 20.5% Y*(xA, C, DE, J, K) (This would be one of the highest frequencies of haplogroup G in the entire world if it were really all G-M201.)
......
.....
6/39 = 15.4% P*(xR1a)
6/39 = 15.4% R1a

Этот гаплогруппный расклад может пролить свет на относительно повышенное содержание "темносинего" (европейского) и "коричневого" (западноазиатского) компонента у уйгуров. Кстати, я еще раз глянул на распределение "австралоидного" (фиолетового) компонента. Оказывается, что его размеры и относительная пропорция к палеосибирскому компоненту у уйгуров такая же, как и остальных популяций Юго-Восточной Азии.
« Последнее редактирование: 07 Январь 2011, 23:14:07 от I2a2a »

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Кстати, у кого-нибудь есть соображения по поводу интерпретации седьмого кластера (светлосиний)?
Он имеет какую-то странную дистрибьюцию среди представленных популяций.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Для сравнения кластерный анализ тех же популяций (при K=3) в статье
Signatures of founder effects, admixture, and selection in the Ashkenazi Jewish population
Steven M. Bray et al.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Похожий анализ популяций при разных K (1,2,3,4,5,6) в статье Ацмона


Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Возможно, что светлосиний кластер на моем графике соответсвует зеленому кластеру (центрально-южноазиаты) в статьей Атцмона.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.