АвторТема: Что следует учитывать, задавая вопросы о матчах и гаплогруппах мтДНК  (Прочитано 6992 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1390/-7
  • Ultimate Matriarchy
Прежде всего, определитесь с вопросом. Например: У меня нашли гаплогруппу H с мутациями..... Что скажете? - вероятно, предполагает одобрение, неодобрение или иное суждение участников о нормальности факта, что у вас нашли данную гаплогруппу? :) Открою страшную тайну: вполне нормально иметь и гаплогруппу L0a, не только H. И даже неандертальскую гаплогруппу иметь вполне нормально для здоровья, такая молекула мтДНК вполне может работать внутри человеческой митохондрии, пусть даже у современных людей неандертальские линии не обнаружены. В связи с этим, не лишне явно пояснить, какого рода реакция ожидается от собеседников и зачем вы информируете нас о своей гаплогруппе.

Итак, конкретные рекомендации.

1. Если вы задаете вопрос о той или иной гаплогруппе, пожалуйста, избегайте фраз вроде "Расскажите плиз о H1225s12ae!". Вероятность получить сколько-нибудь полезный ответ крайне мала, особенно если классификация чрезмерно детальна. Зачастую даже ученые, впервые опубликовавшие сиквенсы той или иной ветви, не в курсе как она называется по последней номенклатуре. Поищите информацию о ближайшей более-менее крупной линии, например на сайте http://gentis.ru, где можно найти и карты распространения. Скажем, если вам поставили диагноз U5b1b1, начните с поиска информации о U5b.

Отвечать на абстрактные вопросы по большим (корневым) линиям тоже достаточно трудно. Пожалуйста, поймите правильно: если кто-то найдет время, чтобы оказать вам помощь, это скорее всего будет ответ на конкретный вопрос, см тематику пунктов ниже, а не лекция на отвлеченную тему о Human Prehistory. Вопрос "Встречается ли гаплогруппа U5b в Африке, какие именно ветви?" куда более приемлем, чем "А какие народы могли занести U5b в Африку?".


2. Если целью вопроса является поиск матчей и уточнение гаплогруппы, пожалуйста, приводите ВСЮ имеющуюся у вас информацию о генотипировании. Желательно указать:

- тестировавшую компанию
- список снипов, если это было исследование на микрочипе (увы, обычно малополезная информация)
- сиквенс ГВС1 (HVR1)
- сиквенс ГВС2 (HVR2), если есть
- сиквенс кодирующей области (CR), если есть
- гаплогруппу, как она была названа лабораторией (если вам типировали только ГВС1 и ГВС2, то скорее всего, для определения гаплогруппы были исследованы еще какие-то точки молекулы, поэтому информация о гаплогруппе не является излишней, по ГВС не всегда определяется гаплогруппа; но если сиквенс полный, т.е. включает всю молекулу - HVR1, HVR2 и CR, то гаплогруппу можно определить по сиквенсу).

В случае, если вы затрудняетесь с наименованием секвенированной области, укажите диапазон б.п.(bp), тестировавшая лаборатория обязательно информирует, на каком участке обнаружены те или иные мутации.

Список отличий следует приводить только по отношению к rCRS. Ни в коем случае не используйте RSRS! Из тестирующих компаний он употребим только в FTDNA и только по причине того, что когда-то научным консультатнтом по мтднк был один из пропагандистов RSRS. В настоящее время rCRS является общепринятым форматом референсной последовательности и никаких планов его замены не существует.

Не приводите ваш номер в базах вроде митосерча - далеко не все люди знают как туда залезть. Предпочтительнее прямая ссылка на профиль. Однако аксешн сиквенса в Генбанке, полного или частичного, может быть полезным.


3. Пожалуйста, не задавайте вопросов вроде "У меня с ближайшим матчем 3 отличия, сколько это лет?" Никто не умеет переводить отличия в мутациях в число лет, по крайней мере с удовлетворительной точностью. Тем не менее, на ваш вопрос иногда можно дать разумный ответ, если вы укажете оба сравниваемых сиквенса.

Учтите: то, что вы (или ваша лаборатория) понимаете под "отличием", таковым может и не быть. Известны мутации, не имеющие никакого филогенетического значения, кроме того, один и тот же сиквенс иногда записывается несколькими способами, в зависимости от примененного алгоритма выравнивания по риференсу. Наконец, разные образцы могли секвенировать в разном диапазоне, например отсутствие отличия от rCRS в позиции 16519 может объясняться тем, что данная точка не была захвачена праймером, а не отсутствием отличия в действительности. Отсюда же - нередкое возмущение "У меня с сестрой разные сиквенсы, как такое может быть?".


4. Если тестировавшая вас лаборатория сама предоставила список совпадений, пожалуйста приведите его, вместо упоминания "на таком-то расстоянии и на таком-то". С измерением "расстояний", то есть количества отличий двух сиквенсов, связана масса проблем, см пункт выше.


5. Не полагайтесь на совпадение названия гаплогруппы у вас с кем-то еще, равно как и на различие в наименованиях. Точно определить гаплогруппу, как правило, можно лишь при наличии полного сиквенса, при этом классификацию желательно уточнять по референсному древу на сайте http://phylotree.org. Если вы и ваш совпаденец имеете полные сиквенсы, следует повторно сравнить правильность класссификации с референсным древом, так как оно время от времени детализируется, а наименования некоторых гаплогрупп устаревают вместе с определяющими мотивами линий. Не полагайтесь на "диагнозы", поставленные по частичным сиквенсам, например только по ГВС1-2! Типовые образцы вопросов на тему классификации:

- У меня (и/или совпаденца) такой-то полный сиквенс(ы), правильно ли определена гаплогруппа(ы)? Возможно ли детализировать классификацию? У нас 1) есть различия в сиквенсах, значимы ли они? 2) Мы полностью совпадаем по полному сиквенсу, можно ли оценить вероятность близкого родства?

- У меня (и/или совпаденца) имеются частичные сиквенсы, корректно ли определена гаплогруппа(ы)? Можно ли точнее? Значителен ли у нас шанс оказаться близкими родственниками, учитывая, что на участках, типированных у нас обоих, различий нет?

Если все предосторожности при наименовании гаплогрупп выполнены, глубина типирования у вас и совпаденцев одинакова (полный сиквенс vs полный, ГВС1-2 vs ГВС1-2), то кандидатами на ближайшее родство могут быть только матчи, классифицированные так же, как ваш образец. И наоборот, разная глубина типирования уменьшает вероятность совпадения гаплогруппы, так как полное секвенирование молекул может выявить немалые различия двух линий, и как следствие, их разное наименование. Итак, чем больше данных об обеих линиях, тем проще судить о степени их родства!


6. Не ищите потенциальных кандидатов на близкое родство среди частичных совпаденцев, с которыми у вас есть различие по ГВС1. Как правило. это тысячелетия и даже десятки тысяч лет. Исключения составляют лишь различия в длине C-тракта между б.п. 16182 и 16193, ну может еще несколько участков. Помните, что даже профессиональные биологи, работающие в коммерческом или судебном генотипировании, часто ошибаются с оценкой значимости мутаций на C- и G-трактах.

Аналогично, не принимайте во внимание различия длины C-тракта 303-315 и области вставки двунуклеотидных повторов в районе б.п. 513-524 в ГВС2. Но помните, что нуклеотидные замены (в отличие от вставок и удалений баз) значимы и на трактах, при условии, что вы располагаете корректным выравниванием. Так, например вставка 16193.1C имеет грошевую стоимость (и пригодна разве что для различения двух близких родственников или даже тканей одного и того же человека), но замена 16189T->C на том же тракте, филогенетически очень важна: если два ГВС1 различаются только в позиции 16189, то как правило, полные молекулы различаются в 5-30 позициях. Напротив, замены 16182C и 16183C являются инделами (вставками-удалениями), замаскированными выравниванием под трансверсии, их филогенетическая стоимость невелика. И наконец, учитывайте, что удлинение C-тракта путем транзиции 16189T->C как правило влечет его удлинение в виде мутаций 16193.1C, 16182C и 16183C (и наоборот, перечисленные мутации как правило, предполагают наличие транзиции на 16189).

Среди позиций, мутирующих быстрее всего (вплоть до небольшого шанса схватить различие в генеалогическом интервале), следует назвать 152, 16093, 16311, 195 и 146. Филогенетическая значимость позиции 16519 спорна.


7. География совпадений имеет значение! Чем ближе к вам расположен матч, имеющий шанс оказаться полным, тем вероятнее родство с этой линией, а не аналогичной (по молекулярным данным), но удаленной географически. Если вы получили список совпадений, то ранжировать их следует с учетом следующего принципа: если три сиквенса совпадают, то скорее всего более родственны те два из них, которые ближе территориально.


От безукоризненности следования перечисленным правилам зависит как время, через которое вы можете получить ответ на вопрос, так и соответствие ответа вашим ожиданиям.

Удачи в молекулярно-генеалогическом поиске.
« Последнее редактирование: 13 Июль 2014, 14:52:38 от Valery »

Оффлайн Andymeon

  • Сообщений: 1179
  • Страна: ru
  • Рейтинг +119/-5
  • Y-ДНК: R1a [CTS 3402+ Y2910+ YP310+]
  • мтДНК: H3i
Valery, а можно ссыль на таинственный "генбанк" ?
А то в гугле мне лишь денежный вклад в банке предлагают сделать  :)
В Генбанк можно заслать свой секвенс ?
Если да, то в какой форме, и какую выгоду\информацию с этого можно получить ?

Оффлайн пенелопа

  • Главный модератор
  • *****
  • Сообщений: 6573
  • Страна: ru
  • Рейтинг +2804/-14
  • мтДНК: H1b

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1390/-7
  • Ultimate Matriarchy
Собственно, выше исчерпывающий ответ Пенелопы

Оффлайн mikhail a.

  • Сообщений: 1476
  • Страна: ru
  • Рейтинг +473/-0
  • Y-ДНК: J2a-PF5252
  • мтДНК: T2b
Насколько филогенетически значима мутация 10777A?

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1390/-7
  • Ultimate Matriarchy
Насколько филогенетически значима мутация 10777A?

исключительно редкая трансверсия, частота порядка 1 на 10000 полных сиквенсов

Оффлайн mikhail a.

  • Сообщений: 1476
  • Страна: ru
  • Рейтинг +473/-0
  • Y-ДНК: J2a-PF5252
  • мтДНК: T2b
исключительно редкая трансверсия, частота порядка 1 на 10000 полных сиквенсов
Спасибо, будет на что ориентироваться :)

Оффлайн Farharaji

  • Сообщений: 984
  • Страна: aq
  • Рейтинг +171/-7
    • Ytree YF71444
  • Y-ДНК: R1b-DF98+FT22607+BY20662+
  • мтДНК: U5b1e1*
А что такое T310TC. Это Тимин вдруг перешел в Тимин и Цитозин вместе взятые? И такое бывает? это как, нормально типа

Оффлайн TK

  • Сообщений: 505
  • Страна: ru
  • Рейтинг +385/-0
А что такое T310TC. Это Тимин вдруг перешел в Тимин и Цитозин вместе взятые? И такое бывает? это как, нормально типа

Это когда сперва в позиции 310 был тимин, а потом он же (тимин) как бы остался, но следом за ним вклинился цитозин.
Именно вклинился, а не встал на 311 позицию.

Судя по всему, это не частая мутация (в позициях старт и финиш в обе введите 310 и нажмите Search):
https://www.mitomap.org/foswiki/bin/view////Main/SearchAllele

В Генбанке таких образцов, видимо, нет, но мутация упоминается в научных статьях (см. ссылки references справа в строках с T-TC).


Оффлайн Ялгай

  • Сообщений: 3
  • Страна: 00
  • Рейтинг +0/-0
  • Y-ДНК: J
Доброго дня!

Поясните, пожалуйста, такие моменты.

Первый вопрос в некоторой степени связан с Вашими пояснениями выше (про С-тракты и пр), но есть некоторые моменты:

В ГВР2 у тетки есть 523.1C и  523.2A, в то время как у ее родственницы, с которым она имеет общего предка, родившегося (родившуюся) в 1739 г., таких нет. Я так понимаю, что филогенетически эти вещи не важны?

Второй вопрос потяжелее) насколько филогенетически важны 195C и 152C при построении mt-древ в YFull?
Я имею в виду в случае с 152C! (восклицательный знак)
« Последнее редактирование: 07 Февраль 2022, 16:58:09 от Ялгай »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.