Прежде всего, определитесь с вопросом. Например:
У меня нашли гаплогруппу H с мутациями..... Что скажете? - вероятно, предполагает одобрение, неодобрение или иное суждение участников о нормальности факта, что у вас нашли данную гаплогруппу?
Открою страшную тайну: вполне
нормально иметь и гаплогруппу L0a, не только H. И даже неандертальскую гаплогруппу иметь вполне
нормально для здоровья, такая молекула мтДНК вполне может работать внутри человеческой митохондрии, пусть даже у современных людей неандертальские линии не обнаружены. В связи с этим, не лишне явно пояснить, какого рода реакция ожидается от собеседников и зачем вы информируете нас о своей гаплогруппе.
Итак, конкретные рекомендации.
1. Если вы задаете вопрос о той или иной гаплогруппе, пожалуйста, избегайте фраз вроде "Расскажите плиз о H1225s12ae!". Вероятность получить сколько-нибудь полезный ответ крайне мала, особенно если классификация чрезмерно детальна. Зачастую даже ученые, впервые опубликовавшие сиквенсы той или иной ветви, не в курсе как она называется по последней номенклатуре. Поищите информацию о ближайшей более-менее крупной линии, например на сайте
http://gentis.ru, где можно найти и карты распространения. Скажем, если вам поставили диагноз U5b1b1, начните с поиска информации о U5b.
Отвечать на абстрактные вопросы по большим (корневым) линиям тоже достаточно трудно. Пожалуйста, поймите правильно: если кто-то найдет время, чтобы оказать вам помощь, это скорее всего будет ответ на конкретный вопрос, см тематику пунктов ниже, а не лекция на отвлеченную тему о Human Prehistory. Вопрос "Встречается ли гаплогруппа U5b в Африке, какие именно ветви?" куда более приемлем, чем "А какие народы могли занести U5b в Африку?".
2. Если целью вопроса является поиск матчей и уточнение гаплогруппы, пожалуйста, приводите ВСЮ имеющуюся у вас информацию о генотипировании. Желательно указать:
- тестировавшую компанию
- список снипов, если это было исследование на микрочипе (увы, обычно малополезная информация)
- сиквенс ГВС1 (HVR1)
- сиквенс ГВС2 (HVR2), если есть
- сиквенс кодирующей области (CR), если есть
- гаплогруппу, как она была названа лабораторией (если вам типировали только ГВС1 и ГВС2, то скорее всего, для определения гаплогруппы были исследованы еще какие-то точки молекулы, поэтому информация о гаплогруппе не является излишней, по ГВС не всегда определяется гаплогруппа; но если сиквенс полный, т.е. включает всю молекулу - HVR1, HVR2 и CR, то гаплогруппу можно определить по сиквенсу).
В случае, если вы затрудняетесь с наименованием секвенированной области, укажите диапазон б.п.(bp), тестировавшая лаборатория обязательно информирует, на каком участке обнаружены те или иные мутации.
Список отличий следует приводить только по отношению к
rCRS. Ни в коем случае
не используйте RSRS! Из тестирующих компаний он употребим только в FTDNA и только по причине того, что когда-то научным консультатнтом по мтднк был один из пропагандистов RSRS. В настоящее время rCRS является общепринятым форматом референсной последовательности и
никаких планов его замены не существует.
Не приводите ваш номер в базах вроде митосерча - далеко не все люди знают как туда залезть. Предпочтительнее прямая ссылка на профиль. Однако аксешн сиквенса в Генбанке, полного или частичного, может быть полезным.
3. Пожалуйста, не задавайте вопросов вроде "У меня с ближайшим матчем 3 отличия, сколько это лет?" Никто не умеет переводить отличия в мутациях в число лет, по крайней мере с удовлетворительной точностью. Тем не менее, на ваш вопрос иногда можно дать разумный ответ, если вы укажете оба сравниваемых сиквенса.
Учтите: то, что вы (или ваша лаборатория) понимаете под "отличием", таковым может и не быть. Известны мутации, не имеющие никакого филогенетического значения, кроме того, один и тот же сиквенс иногда записывается несколькими способами, в зависимости от примененного алгоритма выравнивания по риференсу. Наконец, разные образцы могли секвенировать в разном диапазоне, например отсутствие отличия от rCRS в позиции 16519 может объясняться тем, что данная точка не была захвачена праймером, а не отсутствием отличия в действительности. Отсюда же - нередкое возмущение "У меня с сестрой разные сиквенсы, как такое может быть?".
4. Если тестировавшая вас лаборатория сама предоставила список совпадений, пожалуйста приведите его, вместо упоминания "на таком-то расстоянии и на таком-то". С измерением "расстояний", то есть количества отличий двух сиквенсов, связана масса проблем, см пункт выше.
5. Не полагайтесь на совпадение названия гаплогруппы у вас с кем-то еще, равно как и на различие в наименованиях. Точно определить гаплогруппу, как правило, можно лишь при наличии полного сиквенса, при этом классификацию желательно уточнять по референсному древу на сайте
http://phylotree.org. Если вы и ваш совпаденец имеете полные сиквенсы, следует повторно сравнить правильность класссификации с референсным древом, так как оно время от времени детализируется, а наименования некоторых гаплогрупп устаревают вместе с определяющими мотивами линий. Не полагайтесь на "диагнозы", поставленные по частичным сиквенсам, например только по ГВС1-2! Типовые образцы вопросов на тему классификации:
- У меня (и/или совпаденца) такой-то полный сиквенс(ы), правильно ли определена гаплогруппа(ы)? Возможно ли детализировать классификацию? У нас 1) есть различия в сиквенсах, значимы ли они? 2) Мы полностью совпадаем по полному сиквенсу, можно ли оценить вероятность близкого родства?
- У меня (и/или совпаденца) имеются частичные сиквенсы, корректно ли определена гаплогруппа(ы)? Можно ли точнее? Значителен ли у нас шанс оказаться близкими родственниками, учитывая, что на участках, типированных у нас обоих, различий нет?
Если все предосторожности при наименовании гаплогрупп выполнены, глубина типирования у вас и совпаденцев одинакова (полный сиквенс vs полный, ГВС1-2 vs ГВС1-2), то кандидатами на ближайшее родство могут быть только матчи, классифицированные так же, как ваш образец. И наоборот, разная глубина типирования уменьшает вероятность совпадения гаплогруппы, так как полное секвенирование молекул может выявить немалые различия двух линий, и как следствие, их разное наименование. Итак, чем больше данных об обеих линиях, тем проще судить о степени их родства!
6. Не ищите потенциальных кандидатов на близкое родство среди частичных совпаденцев, с которыми у вас есть различие по ГВС1. Как правило. это тысячелетия и даже десятки тысяч лет. Исключения составляют лишь различия в длине C-тракта между б.п. 16182 и 16193, ну может еще несколько участков. Помните, что даже профессиональные биологи, работающие в коммерческом или судебном генотипировании, часто ошибаются с оценкой значимости мутаций на C- и G-трактах.
Аналогично, не принимайте во внимание различия длины C-тракта 303-315 и области вставки двунуклеотидных повторов в районе б.п. 513-524 в ГВС2. Но помните, что нуклеотидные замены (в отличие от вставок и удалений баз) значимы и на трактах, при условии, что вы располагаете корректным выравниванием. Так, например вставка 16193.1C имеет грошевую стоимость (и пригодна разве что для различения двух близких родственников или даже тканей одного и того же человека), но замена 16189T->C на том же тракте, филогенетически очень важна: если два ГВС1 различаются только в позиции 16189, то как правило, полные молекулы различаются в 5-30 позициях. Напротив, замены 16182C и 16183C являются инделами (вставками-удалениями), замаскированными выравниванием под трансверсии, их филогенетическая стоимость невелика. И наконец, учитывайте, что удлинение C-тракта путем транзиции 16189T->C как правило влечет его удлинение в виде мутаций 16193.1C, 16182C и 16183C (и наоборот, перечисленные мутации как правило, предполагают наличие транзиции на 16189).
Среди позиций, мутирующих быстрее всего (вплоть до небольшого шанса схватить различие в генеалогическом интервале), следует назвать 152, 16093, 16311, 195 и 146. Филогенетическая значимость позиции 16519 спорна.
7. География совпадений имеет значение! Чем ближе к вам расположен матч, имеющий шанс оказаться полным, тем вероятнее родство с этой линией, а не аналогичной (по молекулярным данным), но удаленной географически. Если вы получили список совпадений, то ранжировать их следует с учетом следующего принципа: если три сиквенса совпадают, то скорее всего более родственны те два из них, которые ближе территориально.
От безукоризненности следования перечисленным правилам зависит как время, через которое вы можете получить ответ на вопрос, так и соответствие ответа вашим ожиданиям.
Удачи в молекулярно-генеалогическом поиске.