АвторТема: Интерактивная этнокарта от Hellenthal et al  (Прочитано 4689 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Онлайн SrkzАвтор темы

  • Сообщений: 5634
  • Страна: ru
  • Рейтинг +2375/-2
  • Y-ДНК: N-L1025*
  • мтДНК: U4a1e-pre T16093C T16311T
Вчера появились ссылки на новое исследование Hellenthal et al, например, от нашей замечательной пенелопы:
Время и место миграций человека уточнили с помощью генов

Анализ геномов человеческих популяций позволил установить, с кем и когда они контактировали в недавнем прошлом.
   
Выйдя из Африки и расселившись, наш брат вовсе не остался сидеть на захваченных местах, а продолжал блуждать по земле. Эти блуждания происходили и после формирования цивилизаций, да и продолжаются до сих пор: каждый может вспомнить про миграции варварских племён в древнеримские времена, что же до сего дня, то тут достаточно просто выйти на улицу, чтобы убедиться, что народы по-прежнему в движении и перемешиваются. Такие блуждания иногда происходят мирно, иногда — совсем не мирно, но, так или иначе, это отражается в генетической истории популяции.

Можно ли сейчас, проанализировав геном людей из разных уголков земного шара, восстановить историю миграций?
Это сложно, но вполне возможно, как показали Гаррет Гелленталь (Garrett Hellenthal) из Университетского колледжа Лондона (Великобритания) и его коллеги из Оксфорда и Института эволюционной антропологии Общества Макса Планка (Германия). Учёные проанализировали ДНК почти полутора тысяч человек из 95 популяций по всему миру. Итогом работы стала интерактивная популяционно-генетическая карта человечества; кроме того, результаты исследований опубликованы в журнале Science.

Полученные генетические данные во многих случаях подтверждают исторические: так, например, в ДНК хазарейцев нашли монгольский след, который появился в их геноме во времена Монгольской империи, что вполне согласуется с историческими источниками. Такие же монгольские следы удалось найти ещё в нескольких популяциях вплоть до Турции, в которых они появились примерно в то же время, что и у хазарейцев.

С другой стороны, удалось обнаружить такие генетические примеси, которые до сих пор от внимания исследователей ускользали: например, у людей ту в современном Китае нашли следы европейской ДНК, похожей на ту, что есть у современных греков. Появилась эта европейская примесь около 1 200 года н. э., и связана она, очевидно, с купцами, ходившими в то время Великим шёлковым путём. Надо ли говорить, что нынешние (гео)политические границы слабо отражают миграционно-генетическую картину? Так, на территории Пакистана в некоторых группах обнаруживается влияние древней Европы, в других есть следы африканских арабов, живших южнее Сахары, к третьим в геном затесалась ДНК из Восточной Азии.

http://compulenta.computerra.ru/chelovek/biologiya/10011487/
http://www.sciencemag.org/content/343/6172/747.abstract

Интерактивная популяционно-генетическая карта: http://admixturemap.paintmychromosomes.com/
Карта довольно любопытна. Само исследование я не читал (по причине платности доступа к нему), однако в FAQ, прилагаемом к карте, изложена основная суть метода. Он достаточно сложен - сначала каждый геном (всего использовано 1530 геномов) разбивается на мелкие участки, далее по каждому участку находятся наиболее типичные варианты для макрорегионов - Африка, Америка, Центральная и Южная Азия, Восточная Азия, Европа, Ближний Восток, Океания. Теперь мы имеем что-то наподобие результатов этнокалькулятора в режиме Chromosome painting - каждая хромосома каждого участника раскрашена в радужный цвет. В примере из FAQ у представителя нигерийского народа йоруба получилось ~80% Африки, остальное разделили между собой Ближний Восток, Европа, в меньшей степени Центральная-Южная и Восточная Азия.
Сравнивая между собой эти раскраски, можно моделировать смешение представителей разных популяций, и находить наиболее вероятные варианты - смешивание каких групп могло породить интересующую нас популяцию? Расстояния в сМ между полученными из одного источника участками известны, известны длины этих участков и их количество. Таким образом, можно оценить время их получения. На графиках в правом нижнем углу карты показаны эти соотношения, однако математическая модель не расписывается. Дана такая подробность - если график имеет форму убывающей гиперболы, значит, указанные в заголовке популяции связаны с одним и тем же источником адмикса. Если же наоборот, прибывает - эти две популяции представляют разные источники.
Сразу виден один из недостатков метода - в качестве источников примеси рассматриваются лишь современные популяции, хотя со времен смешения они могли сильно измениться. Непонятно, как вычисляется направление потока генов? Если у северных русских показана польская примесь, а у поляков примесь от северных русских, видимо, это говорит, что они получили общие сегменты из одного источника, которым были праславяне?
Ехидный Поляко уже нашел на карте у литовцев заметную примесь от восточноафриканского народа Hadza. Однако она показывается лишь в одном из вариантов расчета, есть и вполне адекватные - литовцы, как смесь поляков и белорусов. Не понимая сути расчетов, мне сложно интерпретировать этот результат  :)
В любом случае я за применение новых методов, так как, по ощущениям, из традиционных этнокалькуляторов на основе Admixture чего-то нового уже не выжать. Плохо, что на карте практически не представлены народы России, хотя результаты северных русских, чувашей и народов Кавказа смотрятся любопытно.

Онлайн SrkzАвтор темы

  • Сообщений: 5634
  • Страна: ru
  • Рейтинг +2375/-2
  • Y-ДНК: N-L1025*
  • мтДНК: U4a1e-pre T16093C T16311T
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #1 : 15 Февраль 2014, 12:29:37 »
Оказывается, я не заметил сразу supplementary к статье, где алгоритм раскрывается подробно (спасибо подсказке от пенелопы). Возможно, удастся больше понять о сути метода, если продерусь сквозь математику.

Оффлайн Аббат Бузони

  • ...
  • Сообщений: 19622
  • Страна: ru
  • Рейтинг +1490/-57
  • Y-ДНК: I1a2a1a3a1a1a-YP1084+
  • мтДНК: H16
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #2 : 15 Февраль 2014, 13:59:12 »
Поляко не оценил их стараний

Онлайн SrkzАвтор темы

  • Сообщений: 5634
  • Страна: ru
  • Рейтинг +2375/-2
  • Y-ДНК: N-L1025*
  • мтДНК: U4a1e-pre T16093C T16311T
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #3 : 15 Февраль 2014, 14:17:47 »
Поляко не оценил их стараний
Ага, обхихикал  ;D А мне нравится, когда смотрят под новым углом, хотя подозреваю, с датировками они нахимичили.

Оффлайн Аббат Бузони

  • ...
  • Сообщений: 19622
  • Страна: ru
  • Рейтинг +1490/-57
  • Y-ДНК: I1a2a1a3a1a1a-YP1084+
  • мтДНК: H16
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #4 : 15 Февраль 2014, 14:40:09 »
Ну там и связи некоторых народов мягко говоря не айс, сами-то смотрели что получилось.  ;D

Онлайн SrkzАвтор темы

  • Сообщений: 5634
  • Страна: ru
  • Рейтинг +2375/-2
  • Y-ДНК: N-L1025*
  • мтДНК: U4a1e-pre T16093C T16311T
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #5 : 15 Февраль 2014, 15:03:01 »
Ну там и связи некоторых народов мягко говоря не айс, сами-то смотрели что получилось.  ;D
Что там получилось, еще надо разобраться ;D Конкретные народы можно и обсудить. Многие безумные связи проявляются и на уровне предковых компонентов в этнокалькуляторах, допустим, лезгины-немцы, или калаши-шотландцы.

Оффлайн Людмила

  • Сообщений: 1052
  • Рейтинг +145/-1
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #6 : 15 Февраль 2014, 15:36:55 »
Srkz
Цитировать
Карта довольно любопытна. Само исследование я не читал (по причине платности доступа к нему)
Это не сложно обойти, могу прислать статью.

Онлайн SrkzАвтор темы

  • Сообщений: 5634
  • Страна: ru
  • Рейтинг +2375/-2
  • Y-ДНК: N-L1025*
  • мтДНК: U4a1e-pre T16093C T16311T
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #7 : 15 Февраль 2014, 15:53:47 »
Srkz
Цитировать
Карта довольно любопытна. Само исследование я не читал (по причине платности доступа к нему)
Это не сложно обойти, могу прислать статью.
Большое спасибо за предложение, хорошие люди мне уже прислали ))

Оффлайн I2a1a

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #8 : 15 Февраль 2014, 16:51:08 »
Цитировать
As detailed in the paper, this data has been merged from multiple different sources, undergone QC to remove SNPs with low missingness, and has been phased using SHAPETIv2.



Судя по этой цитате, при подготовке выборки они использовали тот же метод, что и я в провальной версии бета-калькулятора WorldK23.
Позднее я отказался от этого метода, поскольку определение отсутствующих генотипов (так называемая импутация) в выборке где представлены сэмплы с большим количеством непрекрывающихся снипов неизбежно приводит к искажению истинной генетической структуры популяции.


Впрочем, авторы сами признают недостатки этого метода


Цитировать
As CHROMOPAINTER uses haplotype information to infer relatedness among individuals, phasing is an important component of analysis. In theory, our inference may be biased if different groups within a dataset are phased di erently, e.g. if only a subset are phased together.
Specifically, phasing populations in such a manner would likely make them look more similar to one another than to other groups that were phased separately, and CHROMOPAINTER might therefore capture this false strong "relatedness". We believe in general that provided samples are phased "exchangeably", many details of phasing approach (e.g. the inclusion of panels of individuals with fixed phase assumed known, not subsequently included in the analysis) ought
not to have a very strong impact. This is because equally shared noise or biases introduced by phasing choices should be accounted for by the mixture representation and painting "cleaning" step




Кстати, в приведенной цитате кроется ошибка  - вместо "low missingness" нужно читать high missigness, иначе фраза не имеет смысла.

 

« Последнее редактирование: 15 Февраль 2014, 17:41:42 от I2a1a »

Оффлайн kapustin

  • Сообщений: 172
  • Рейтинг +18/-0
  • Y-ДНК: E1b1b1b2a1a4
  • мтДНК: V7b
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #9 : 15 Февраль 2014, 17:28:17 »
По моему это не очень корректно. Раньше тоже выявляли по аутосомам предков (по моему этот бизнес запустила бывшая жена Брина -основателя Google) и в результатте они находили индейских предков (какой то процент генов) чуть ли не у жителей Центральной России. Насколько вообще этим аутосомным тестам можно доверять?

Оффлайн kapustin

  • Сообщений: 172
  • Рейтинг +18/-0
  • Y-ДНК: E1b1b1b2a1a4
  • мтДНК: V7b
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #10 : 15 Февраль 2014, 17:30:30 »
Вспомнил - 23 and me. Мне кажется - если у них закажешь тест окажешься чцть ли не полинезийцем.

Онлайн SrkzАвтор темы

  • Сообщений: 5634
  • Страна: ru
  • Рейтинг +2375/-2
  • Y-ДНК: N-L1025*
  • мтДНК: U4a1e-pre T16093C T16311T
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #11 : 15 Февраль 2014, 17:38:59 »
По моему это не очень корректно. Раньше тоже выявляли по аутосомам предков (по моему этот бизнес запустила бывшая жена Брина -основателя Google) и в результатте они находили индейских предков (какой то процент генов) чуть ли не у жителей Центральной России. Насколько вообще этим аутосомным тестам можно доверять?
Здесь надо не так ставить вопрос. Современные индейцы не могут быть предками жителей центральной России. Однако индейцы и жители России имеют некоторых общих предков - или, как минимум, часть наших предков была похожа между собой. Это доказывают результаты анализа останков мальчика со стоянки Мальта, жившего в Сибири во время ледникового периода, до заселения Америки.
Точно так же и по этой карте. Модель предполагает смешивание современных популяций, но мы знаем, что этого не было. Значит, она показывает наличие общих предков, и картина становится разумнее  :) Хотя вопросов к модели много. Даты адмиксов явно можно выкинуть, так же как и second event, если оно есть.

Оффлайн kbg

  • Сообщений: 761
  • Страна: ua
  • Рейтинг +103/-0
  • Днипро
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #12 : 15 Февраль 2014, 18:17:34 »
Вспомнил - 23 and me. Мне кажется - если у них закажешь тест окажешься чцть ли не полинезийцем.
Почему же, мне (мама русская с Волги, отец белорус) они показывают вполне реалистическую картину:

99.7% European
65.3% Eastern European
 
Northern European
0.1% Finnish - я бы сказала, что это привет от моей прабабки со стороны мамы (моя мито-линия, возможно, мордва)
0.4% Nonspecific Northern European
 
Southern European
0.1% Nonspecific Southern European

33.9% Nonspecific European

0.3% Unassigned

А это мама-волжанка:

98.8% European
65.7% Eastern European
 
Northern European
1.6% Finnish
3.1% Nonspecific Northern European
 
Southern European
0.1% Nonspecific Southern European

28.4% Nonspecific European

0.3% East Asian & Native American
 
East Asian
0.1%
Yakut
0.2%
Nonspecific East Asian
0.1%
Nonspecific East Asian & Native American
0.8%
Unassigned

Оффлайн I2a1a

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #13 : 15 Февраль 2014, 18:41:13 »
Алгоритмы имплементированные в Globetrotter крайне интересны - они представляют собой некий гибрид между алгоритмами Chromopainter/fineStructure (что неудивительно, так как в числе авторов обсуждаемой карты и статьи фигурируют разработчики этих программ) и алгоритмами Admixtools/Alder. Не вдаваясь в нудное обсуждение деталей закулисной математики статистики, суть метода сводится к следущему (зеленым цветом я выделил этапы, основанные на алгоритмах fineStructure/Сhromopainter, синим - алгоритмы, альтернативные алгоритмам Admixtools/Alder)


1) Геном каждого отдельного генома в выборке разбивается похромосомно на мелкие chunks ("куски"), и затем с помощью программы Chromopainter производится вычисление попарной матрицы общих "кусков" в режиме" между всеми геномами выборке. Данные матрицы на выходе преобразуются в популяционный вектор, в котором каждый индивид-реципиент представляется в виде мозаичной смеси фрагментов геномов других индивидов в выборке.
2) Затем генерируется 10 произвольных "хромопэйнтинига" для каждого индивида-реципинента
3) После чего происходит первичное моделирование адмикса с помощью регрессионного анализа, в которой популяционный вектор реципиентов выступает в качестве "критериальной" зависимой переменной, а популяционный вектор доноров - в качестве предикторов.
4) Полученные в ходе этого анализа коэффициенты регресии применяются для уточнения "хромопэйнтинга" таким образом, что на основании значений коэффициентов регрессии каждой популяций-донору назначаются вес. Каждый ненулевый вес применяется к тем популяциям, которые вносят значимый вклад в адмикс.
5) На следующем этапе генерируются эмпирические кривые "coancestry" ("сопроисхождения", т.е доли сегментов общего происхождения), cначала  берутся "взвешенные" значения взятых попарно сегментов популяций-доноров, эти сегменты удалены друг от друга на генетической дистании G (выраженной в cM). Кривая строится на основании измерения отношения усредненного произведения весов (на определенной генетической дистанции) к усредненному произведению весов на всем геноме в рассматриваемой паре популяций. Это кривая отображает отношение угасания "предковых" значений LD (неравновесного сцепления) к генетической дистанции (cM). Интересно, что каждый индивид представлен здесь двумя "гаплоидами" (т.е фазированными формами своих генотипов). В целях избежания искажения из-за неизбежных ошибок фазирования, авторы предлогают суммировать значения весов в обеих "гаплоидах" индивида.
6) После чего происходит fitting, т.е пригонка кривых "сопроисхождения" в целях вычисления MLE (наиболее вероятной оценки) параметра "лямбда" - экспотенциального распередления значений скорректированных значений всех кривых "сопроисхождения". На основании этого параметра вычисляется время событий адмикса в поколениях.  95% доверительный интервал вычисляется с помощью метода бутстрэппинга.
7)  На основе значений популяционного вектора и коэффициентов регрессии адмикса вычислются а и b компоненты истинного aдмикса.

8) Производится новая наиболее вероятная оценка коэффициента адмикса в популяции-реципиента в целом путем интерполяции и бустстрэппинга а установленных значений коэффициента адмикса в первой популяции-донора  и 1-а значений коэффициента адмикс в популяции второго донора.


 

Оффлайн zastrug

  • ...
  • Сообщений: 10564
  • Страна: tt
  • Рейтинг +1857/-46
  • I2b1c (P78+)=I2a2a1b1a
  • Y-ДНК: I2b1c
  • мтДНК: T2a1a
Re: Интерактивная этнокарта от Hellenthal et al
« Ответ #14 : 16 Февраль 2014, 01:23:44 »
Вспомнил - 23 and me. Мне кажется - если у них закажешь тест окажешься чцть ли не полинезийцем.
Вспомнили!? ???
Возможно на это повлияло то, что вы пишите в разделе, где половина открытых тем посвящена обсуждению результатов исследований в 23andMe, а вторая половина таким же результатам от FF?

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100