АвторТема: Анализ генетического родства 20 популяций России и СНГ по полиморфизмам HLAII  (Прочитано 24585 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Valery

  • Сообщений: 10101
  • Страна: 00
  • Рейтинг +1374/-7
  • Ultimate Matriarchy
Цитировать
Интересно, а почему мари не легли ближе к чувашам, а наоборот к мордовианам Морковии

значит кохалися ашелями с мордовианами  :)

Оффлайн Аббат Бузони

  • ...
  • Сообщений: 19863
  • Страна: ru
  • Рейтинг +1812/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!
Цитировать
Интересно, а почему мари не легли ближе к чувашам, а наоборот к мордовианам Морковии

значит кохалися ашелями с мордовианами  :)

Не вижу исторического подоплёка для кохания. :-\

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Завтра отпишу здесь обещанное.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Как я уже говорил в другой ветке форума, мне удалось предсказать HLA типы/расширенные гаплотипы HLA-MHC гаплотипы при помощи SNP-ов, типированных в компании 23andme.

Для начала вкратце о методологии, использованной в этом опыте.
Я использовал raw data файлы 23andme, в которых приведены аллели SNP-ов, локализованных на 6 хромосоме в регионе главного комплекса гистосовместимости ( у человека главный комплекс гистосовместимости находится в хромосоме 6 и называется HLAчеловеческий лейкоцитарный антиген).

I.Для начала, при помощи Perl-скрипта, я привел исходные данные Raw Data в PED/MAP формат программы Plink. Затем c помощью специальной команды в программе Plink выделил подмножество всех SNP-ов, находящихся на 6 хромосоме и произвел перекодировку (plink --chr 6 --recode) в новый файл PED/MAP.
II. Далее я установил на свой компьютер фронт-энд Perl-программы HLA*IMP (+ модуль фазирования, написанный на C++), с помощью которой были подготовлены необходимые для процесса приписывания (Imouting) гаплотипов HLA-MHC определенным комбинациями SNP-ов.
III. Первоначально, я преобразовал  вышеупомянтый файл PED/MAP с генотипами 6 хромосомы во входной формат HLA*IMP. Затем, я отфильтровал генотипы 6 хромосомы по качеству генотипирования, отсеев SNP-ы с низким качеством генотипирования, а также те SNP-ы, которые расположены вне региона главного комплекса гистосовместимости. Полученный на выходе файл был проанализирован на предмет соответствия цепочки ДНК (DNA-strand) генотипов входного файла   цепочке ДНК генотипов рефересного файла, содержащего фазированные гаплотипы из панели CEU проекта HapMap. Технически этот анализ был выполнен с ипользованием встроенного в HLA*IMP алгоритма элайнинга (aligning) - "выравнивании" входных генотипов по рефересному набору данных из  панели CEU проекта HapMap.
После чего было проведено собственно фазирование (фейзинг) генотипов, т.е преобразование диплоидных генотипов в гаплотипную фазу. В качестве референса использовались фазированные гаплотипы из той же панели CEU проекта HapMap.Это дефолтная настройка программы, и в нашем случае я ее оставил без изменения, т.к. происхождение лиц, чьи гентопы были использованы, - сугубо европейское.

IV. Файл с 2 фазированными гаплотипами SNP-ов региона HLA-MHC, полученный в результате фазирования был загружен на сервер разработчиков HLA*IMP для установления/aтрибуции (импьютинга) типа HLA-локусов ( A, B, C,DRB1,DQA1,DQB1) на основе аллельных значений SNP-ов  из вышеупомянутых фазированных гаплотипов.

V. Сам процесс импьютинга занял что-то около 40 минут, и на выходе были получены по два файла на каждый из импьютированных локусов. Первый файл содержал best-guess (т.е наиболее вероятный тип), второй - таблицы прочих типов с апостериорной вероятностью).

HLA-A

IndividualID Chromosome HLAA Q
N1 1 0101 0.995644509792
N2 2 2601 0.990402042866
 
HLA-B

IndividualID Chromosome HLAB Q
N1 1 0801 0.998949408531
N2 2 3801 0.950459659100

HLA-C

IndividualID Chromosome HLAC Q
N1 1 0701 0.900771856308
N2 2 1203 0.998344004154

HLA-DQA

IndividualID Chromosome HLADQA Q
N1 1 0501 0.999986469746
N2 2 0102 0.834153175354

HLA-DQB

IndividualID Chromosome HLADQB Q
N1 1 0201 0.987003028393
N2 2 0602 0.967625081539

HLA-DRB

IndividualID Chromosome HLADRB Q
N1 1 0301 0.999830305576
N2 2 1501 0.999707043171

VI. Затем я записал полученные гаплотипы в более привычном "серотипическом" виде, и таким образом оба моих предсказанных гаплотипа выглядят следущим образом

Nr.1HLA A*0101 : Cw*0701 : B*0801 :DRB1*0301 : DQA1*0501 : DQB1*0201Nr.2HLA A*2601 : Cw*1203 : B*3801 :DRB:1501  : DQA1*0102 : DQB1* 0602

VII. Затем я повторил все операции, описанные в пунктах (I-VI), но на этот раз использованием аналогичных данных моей мамы. Конечный результат выглядит следущим образом

Nr.1HLA A*0101 : Cw*0701 : B*0801 :DRB1*0301 : DQA1*0501 : DQB1*0201Nr.2HLA A*2601 : Cw*0102 : B*2705 :DRB1*0101 : DQA1*0101 : DQB1*0501

При сравнении моих гаплотипов с гаплотипами матери, видно что совпадает гаплотип
HLA A*0101 : Cw*0701 : B*0801 :DRB1*0301 : DQA1*0501 : DQB1*0201.
По этому можно утверждать, что именно этот гаплотип я унаследовал от матери, причем в нерекомбинантном виде.

 


Оффлайн Eugene

  • Санктпетербурхъ
  • Сообщений: 6776
  • Страна: th
  • Рейтинг +1080/-41
    • N1c1 Y-DNA Project
  • Y-ДНК: N-BY32524
  • мтДНК: U-C1341T
Вадим,
Очень интересно. А какие-нибудт выводы-результаты (корреляции, проценты) по каким-либо выборкам будут?

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Можно спросить, какое практическое значение имеет это полученное новое знание гаплотипа HLA , скажем для генеалогии или оценки мед.генетических рисков?

Чтобы ответить на этот вопрос, достаточно вспомнить, что в работах по мед.генетике локусам HLA уделяется большое внимание, особенно в связи с аутоиммуными заболеваниями и пр. (в том числе риск отторжения плода и выкидыша во время беременности). Поэтому я не буду сейчас останавливаться на медицинских аспектах, и сразу перейду к предмету непосредственного интерса для молекулярных генеалогов - а именно к вопросу о происхождении.

Начну с того, что примерно полтора года назад я стал наблюдать в Relative Finder (23andme) весьма странную картину появления большого количества генетических кузенов (в терминах 23ия: 5th-Distant cousins), разделявших как между собой, так и со мной общий по происхождению сегмент ДНК (HIR-сегмент, или как у нас принято говорить УПС), локализованный на 6 хромосоме. "Предковая" география "новоявленных генетических кузенов" была столь обширна (от Турции до Ирландии), что не оставляла надежд на обнаружение общего предка этой группы лиц  в генеалогически обозримом интервале времени. Поэтому я приступил к анализу этого необычного сегмента. Как выяснилось, он практически совпадал (в переделах округленных 23ия значения мегабаз) с координатами HLA-локуса. После некоторых колебаний, я озвучил на межфоруме свою точку зрения, согласно которой вышеупомянутый сегмент отражает наличие общего HLA-гаплотипа у сравниваемой группы лиц. Из этой заключения следовало другое заключение о характере и происхождении этого общего сегмента - это должен а) быть достаточно древний консервативный сегмент  и b) этот сегмент должен иметь частоту распространения не менее 10-15% в среде лиц европейского происхождения, чтобы его можно выявить в значительной группе лиц из сформированой случайным образом коммерческой выборки, типа базы данных 23andme.

Помню, что в ответ на мое предположение, один из столпов ДНК-генеалогии -Энн Тернер- сделала замечание (которое тогда мне показалось разумным). По ее мнению, самое существование столь длинного гаплотипа (достаточно длинного, для того чтобы пройти нижний порог детектирования "совпадения" в алгоритме RF в 23andme!!) противоречит тому, что мы знаем о характере наследования HLA.
Как известно гены HLA наследуются кодоминантно и передаются потомству двумя блоками - по одному от каждого родителя  Такой блок носит название гаплотипа HLA.  И хотя частота рекомбинаций внутри гаплотипа HLA составляет около 1%, в материнской хромосоме она несколько выше, однако на протяжений 100 поколений (или 100 последовательных мейозов, в которых при образовании гамет родительские гаплотипы расходятся и затем включаются  в зиготу), вероятность рекомбинации должна достигнуть приличных значений.

Неудовлетворившись таким заключением эксперта, я некоторое время самостоятельно изучал литературу по HLA-MHC. Как оказалось на самом деле, существуют некоторые гаплотипы, которые в силу действия естественного отбора, имеют пренебрежимо низкую рекомбинацию, что придает им "квазинерекомбинаторный" характер. 

Наиболее известным примером такого расширенного гаплотипа HLA-MHC является HLA A1-B8-DR3-DQ2(в сокращенной записиA1::DQ2 или AH8.1)

Цитировать
"Длиной в 4700 тысяч нуклеотидов , A1::DQ2 является вторым по длине гаплотипом, определенных в геноме человека. Сущестование А1.::DQ2создает головоломку для эволюционного исследования рекомбинации, так как при быстрых темпах эволюции рекомбинация HLA локуса должна была привести к ""распаду" таких длинных гаплотипов.
Происхождение  А1::DQ2  довольно трудно проследить, хотя и были выдвинуты предложения о существовании общего предка носителей этого гаплотипа   в Иберии или в Африке. Несмотря на то, что  место происхождения до сих пор является предметом споров, между ученными существует консенсус в том, что носители европейской AH8.1 связаны общим происхождением. А1.::DQ2является наиболее частымгаплотипом в генофонде жителей США европейского происхождения,составляя примерно~ 15%.

 Исследования показывают, что гаплотип A1:: DQ2 получил эволюционную значимость, скорее всего, из-за положительного отбора пре-неолитического периода и изоляции в странах, где пшеница не являлась основным видом злаков.Кроме DR3-DQ2 (известная ассоциация с аутоиммунными заболеваниями и другими факторами, наличие A1:: DQ2, как полагают, также способствует риску развития аутоиммунных заболеваний .Кроме того, около десятка воспалительных заболеваний иммунной системы можно отнести в группа риска для носителей этого гаплотипа. Некоторые болезни, такие как целиакия в первую очередь ассоциируется с определенными генами. Хотя другие заболевания, такие как сахарный диабет первого типа могут ассоциироваться сразу с несколькими генами. Тем не менее другие заболевания, как миастения не имеют такой ассоциации. "(С) Википедия

Пока я читал все материалы, число совпаденцев по обсуждаемому здесь сегменту росло. В настоящий момент, совокупное множество моих матчей по одному только этому сегменту в Ancestry Finder составляет 315/720, т.е 43,75%от общего числа совпаденцев. И это по одному сегменту!

Затем я протестировал свою маму, и оказалось, что 97% процентов этих совпаденцев по одному сегменту 6 хромосомы присутствуют и у нее. Более того, как выяснилось, эти сегменты/блоки "растут" в длине, хотя по логике во время рекомбинации они должны разбиваться при  обмене участками гомологичных хромосом во время конъюгации в профазе I мейоза.  Таким образом, степень сцепленного наследования по этому сегменту с количеством мейзов, похоже только усиливается, поскольку отсутствие кроссинговера не вносит возмущение в картину сцепленного наследования.
« Последнее редактирование: 25 Октябрь 2011, 23:39:38 от I2a1a »

Оффлайн Valikhan

  • Группа N
  • *
  • Сообщений: 2193
  • Страна: kz
  • Рейтинг +102/-1
  • Ysearch 63CDM. Mitosearch EEVT3
    • Turkic World
  • Y-ДНК: N1c1d1 - L1034 (L1032, L1033)
  • мтДНК: B5a1a
С интересом жду продолжения. Хоть пока и нет ни одного совпадения на этом блоке.

На линухе отрабатываете?

Оффлайн Eugene

  • Санктпетербурхъ
  • Сообщений: 6776
  • Страна: th
  • Рейтинг +1080/-41
    • N1c1 Y-DNA Project
  • Y-ДНК: N-BY32524
  • мтДНК: U-C1341T
Вадим,
+1
Пять баллов.
И Вы также раскрыли тайну бОльшего количества матчей в 23эндми.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Вадим,
Очень интересно. А какие-нибудт выводы-результаты (корреляции, проценты) по каким-либо выборкам будут?

Разумеется, будут.

Самая главная корреляция - это то, что мне можно смело забыть о 43% процентах матчей в RF, или вернее, прекрать поиски общего предка. Бо жил он, скорее всего в самом начале неолитической революции.

Но вернусь к своим гаплотипам. Из 2 моих гаплотипов наиболее интересен, разумеется, вот этот

HLA A*0101 : Cw*0701 : B*0801 :DRB1*0301 : DQA1*0501 : DQB1*0201

Это и есть тот самый HLA A1-B8-DR3-DQ2(A1::DQ2 или AH8.1, ancestral MHC 8.1, COX или просто "Super 8 " ;D ).  Просто мой гаплотип приведен в расширенной серотипической форме, с включением C и DQA1 локусов.

Здесь довольно таки интересная информация о "Супер 8"

http://en.wikipedia.org/wiki/HLA_A1-B8-DR3-DQ2


Существует несколько крупных международных баз данных, по которым можно посмотреть распространение этого (и других) HLA-MHC гаплотипов.

Вот, например, эта

http://www.allelefrequencies.net/default.asp
« Последнее редактирование: 25 Октябрь 2011, 23:47:18 от I2a1a »

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
С интересом жду продолжения. Хоть пока и нет ни одного совпадения на этом блоке.

На линухе отрабатываете?

Нет, на Винде.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Хоть пока и нет ни одного совпадения на этом блоке.

Не исключено, что у Вас редкий гаплотип или редкие гаплотипы

Оффлайн Valikhan

  • Группа N
  • *
  • Сообщений: 2193
  • Страна: kz
  • Рейтинг +102/-1
  • Ysearch 63CDM. Mitosearch EEVT3
    • Turkic World
  • Y-ДНК: N1c1d1 - L1034 (L1032, L1033)
  • мтДНК: B5a1a
С интересом жду продолжения. Хоть пока и нет ни одного совпадения на этом блоке.

На линухе отрабатываете?

Нет, на Винде.
Не набросаете мануал? Помучаюсь на досуге.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Вышеупомянутая база данных позволяет искать частоты распространения в разных популяциях, - как по отдельным аллелям HLA, так и по расширенным гаплотипам.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
С интересом жду продолжения. Хоть пока и нет ни одного совпадения на этом блоке.

На линухе отрабатываете?

Нет, на Винде.
Не набросаете мануал? Помучаюсь на досуге.

На сайте HPA*IMP есть вроде мануал, а в этом топике я изложил последовательность действий.

Оффлайн Valikhan

  • Группа N
  • *
  • Сообщений: 2193
  • Страна: kz
  • Рейтинг +102/-1
  • Ysearch 63CDM. Mitosearch EEVT3
    • Turkic World
  • Y-ДНК: N1c1d1 - L1034 (L1032, L1033)
  • мтДНК: B5a1a
На сайте HPA*IMP есть вроде мануал, а в этом топике я изложил последовательность действий.
Вот этот сайт?
https://oxfordhla.well.ox.ac.uk/hla/documentation

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.