АвторТема: Данные mtDNA в аутосомном файле - какую информацию можно получить?  (Прочитано 335 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mask-13Автор темы

  • Сообщений: 38
  • Страна: ru
  • Рейтинг +5/-0
Добрый день!

Открыл в Экселе 15-мегабайтный файл своего аутосомного анализа в формате 37 (от FTDNA), и с удивлением обнаружил там 179 штук таких SNP, где в поле Хромосома указано "МТ" (а в названии, т.е. RSID, часто есть слово Mito)
Вот примеры:

RSID, CHROMOSOME, POSITION, RESULT

MitoT217C,MT,217,TT
200610-105,MT,236,TT
MitoT491C,MT,489,TT
2010-08-MT-723,MT,513,GG
2010-08-MT-729,MT,523,AA
2010-08-MT-830,MT,711,TT
1SNP794FT_A,MT,794,AA
1SNP825FT_A,MT,825,TT
200610-75,MT,951,GG
MitoC1050T,MT,1048,CC
rs267606618,MT,1095,TT

Я примерно догадываюсь, откуда эти данные - на чип ведь попадают все ошметки от раздербаненной клетки, там и ядерный ДНК, и митохондрии, и куча мусора типа обломков других органелл.

У меня два вопроса:
1. Насколько точны эти данные, это реально SNP моей митохондриальной ДНК?
2. Как мне по этим данным понять примерную митохондриальную гаплогруппу? Я видел где-то аналогичный софт или сервис для Y-хромосомы. У некоторых фирм (не FTDNA) в аутосомном файле есть SNP Y-хромосом, и по SNP можно примерно определить гаплогруппу (хотя и не так точно как по STR, потому что STR мутируют часто, а SNP редко).

Оффлайн Farroukh

  • Maternal Y-DNA: R1b-L584
  • ...
  • Сообщений: 11990
  • Страна: az
  • Рейтинг +2398/-15
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f

Оффлайн Mask-13Автор темы

  • Сообщений: 38
  • Страна: ru
  • Рейтинг +5/-0

Оффлайн Mask-13Автор темы

  • Сообщений: 38
  • Страна: ru
  • Рейтинг +5/-0
Что-то получилось!
У меня нет ни "HVR DIFFERENCES FROM RSRS", ни rCRS, ведь я никогда не сдавал тест mtDNA.
Мой файл - в формате Family Finder, и когда я залил его в предиктор, тот сообщил, что "файлы в формате фэмили файндер не поддерживаются. Найдено 0 маркеров"

Но я понял, что там нужно (там это написано). Нужен файл в таком формате:

73G 263G 315.1C 497T 750G 1189C 1438G 1811G 2706G 3480G 4769G 5585A 7028T 8860G
9055A 9138Y 9698C 10398G 10550G 11299C 11467G 11470G 11719A 11914A 12308G 12372A
14167T 14766T 14798C 15326G 15924G 16093Y 16222T 16224C 16311C 16362C 16519C

Число - это позиция, а буква - это значение. Также там можно указать специальным образом инделы и гетероплазмию, но у меня этих данных нет, только отдельные base pairs. Итак, немного "биоинформатики" на коленке (в экселе), и я переформатировал свой файл. Из строк такого типа:

1SNP56FA_T;MT;56;TT

Я делал такие:

56Т

Т.е. брал позицию, а в значении из двух букв оставлял одну (в каждой base pair для MT обе буквы всегда совпадали). В трех позициях в значении вместо букв были минусы (--). Т.к. я не знаю, что это, пришлось эти данные выкинуть. Таким образом я получил такой файл:

56T 215A 217T 236T 489T 513G 523A 711T 794A 825T 951G 1048C 1095T 1438G 1494C 1555A 1721C 2158T 2417G 706G 2755A 2880A 3010G 3027T 3200A 3203A 3206C и т.д.

Предиктор скушал файл на ура, распознав его как rCRSdiff :

mthap version 0.19b (2015-05-11); haplogroup data version PhyloTree Build 17 (2016-02-18) +mods
raw data source MT.txt (1KB)
rCRSdiff format was uploaded. Based on the markers found, assuming the following regions were completely sequenced: HVR1 (16001~16569) HVR2 (1~574) CR (575~16000).
Found 16745 markers at 16736 positions covering 100.0% of mtDNA.
 
Тут меня немного смущает фраза "Found 16745 markers" ведь в моем файле всего 176 маркеров...(?)
Тем не менее, нашлась какая-то гаплогруппа:

Best mtDNA Haplogroup Matches:

1) H2a2a1

Defining Markers for haplogroup H2a2a1:
HVR2:
CR:
HVR1:

Marker path from rCRS to haplogroup H2a2a1 (plus extra markers):
H2a2a1(rCRS) ⇨ 56T 794A 1438G 2417G 2706G 3200A 3552A 7927G 7930T 8862T 11242G 11467G 11629T 12308G 12481A 12492T 12546T 13958C 13973T 15487T 15638T

Good Match! Your results also had extra markers for this haplogroup:
Extras(21): 56T 794A 1438G 2417G 2706G 3200A 3552A 7927G 7930T 8862T 11242G 11467G 11629T 12308G 12481A 12492T 12546T 13958C 13973T 15487T 15638T

Есть и другие гаплогруппы, но они не "Good match", а "Imperfect match".

Вопрос:
1. Нет ли в моих действиях какой-то ереси?
2. Предиктор пишет, что результат выдан в таком предположении: "assuming the following regions were completely sequenced: HVR1 (16001~16569) HVR2 (1~574) CR (575~16000).". В моем случае это неправда. Насколько это меняет дело?
2. Насколько вероятен полученный результат? Я раньше пользовался предикторами Y-гаплогрупп, и они всегда вместе с гаплогруппой выдавали вероятность.
Какая в данном случае вероятность? Хотя бы примерно? Насколько реально  вообще определить мито-ГГ H2a2a1 по 176 маркерам?
3. Могу ли я на 100% быть уверен, в том, что у меня точно ГГ какого-то верхнего уровня, например, H или H2?

Оффлайн Mask-13Автор темы

  • Сообщений: 38
  • Страна: ru
  • Рейтинг +5/-0
Сам перечитал свое ссобщение, и теперь мне кажется, что полученный результат не корректен.
Это ведь "diff", т.е. расхождения с каким-то стандартом.
Поэтому предиктор и посчитал, что "Found 16745 markers", т.е. он предположил, что по остальным маркерам у меня нет расхождений, и их значение известно.
Надо как-то по-другому залить данные, чтобы предиктор понял, что у меня нет никаких данных по большинству маркеров.

Оффлайн R1a-Stolin

  • Сообщений: 588
  • Страна: 00
  • Рейтинг +297/-1
  • Y-ДНК: R-FT64992 - Сіціцк, Беларусь
  • мтДНК: H - Умань, Україна
H2a2a1 это стандартная Кембриджская последовательность: http://xn--c1acc6aafa1c.xn--p1ai/?page_id=2082. Такой результат предиктор выдаёт всем когда нет данных.
Халявы не будет, прийдётся делать тест на мито - если всё ещё интересно.

:)

Оффлайн Mask-13Автор темы

  • Сообщений: 38
  • Страна: ru
  • Рейтинг +5/-0
Халявы не будет, прийдётся делать тест на мито - если всё ещё интересно.

Неужели даже первой буквы гаплогруппы не определить?

Конечно мне интересно, но когда я решу выделить деньги из семейного бюджета на тест мито, то я в первую очередь сделаю этот тест своему отцу-пенсионеру, а не себе. Во вторую очередь кому-то еще из старших родственников - пока они живы, слава богу. Сам я в списке на мито-тест где-то ближе к концу.
Поэтому хочется что-то извлечь из имеющейся информации. Не халявы ради, а во имя разумной траты денег.

Оффлайн Farroukh

  • Maternal Y-DNA: R1b-L584
  • ...
  • Сообщений: 11990
  • Страна: az
  • Рейтинг +2398/-15
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f
Увы, там нет толковых данных, минимально необходимых для предикции.
Можете не искать проблему в своих действиях - Ваш файл изначально не годился

Оффлайн R1a-Stolin

  • Сообщений: 588
  • Страна: 00
  • Рейтинг +297/-1
  • Y-ДНК: R-FT64992 - Сіціцк, Беларусь
  • мтДНК: H - Умань, Україна

Неужели даже первой буквы гаплогруппы не определить?

Конечно мне интересно, но когда я решу выделить деньги из семейного бюджета на тест мито, то я в первую очередь сделаю этот тест своему отцу-пенсионеру, а не себе. Во вторую очередь кому-то еще из старших родственников - пока они живы, слава богу. Сам я в списке на мито-тест где-то ближе к концу.
Поэтому хочется что-то извлечь из имеющейся информации. Не халявы ради, а во имя разумной траты денег.

К сожалению нет. Этот предиктор можно использовать только для файлов 23andme.
Многие тут считают, что мито тест для генеалогии бесполезен, только ради науки и собственного любопытства.

Оффлайн Томми

  • Сообщений: 201
  • Рейтинг +53/-0
  • Y-ДНК: I2a2b L38 S2606
  • мтДНК: H3f

К сожалению нет. Этот предиктор можно использовать только для файлов 23andme.
Многие тут считают, что мито тест для генеалогии бесполезен, только ради науки и собственного любопытства.
У меня выдал 2 варианта, но ни один не совпал с тем что показал тест 23andme

Оффлайн R1a-Stolin

  • Сообщений: 588
  • Страна: 00
  • Рейтинг +297/-1
  • Y-ДНК: R-FT64992 - Сіціцк, Беларусь
  • мтДНК: H - Умань, Україна
23andme не тестирует всю митохондрию, а отдельные мутации и в итоге иногда ошибочно распределяет по субкладам. У меня самого не совпадает субклад H на FTDNA и 23andme, более достоверная информация на FTDNA.

Оффлайн Томми

  • Сообщений: 201
  • Рейтинг +53/-0
  • Y-ДНК: I2a2b L38 S2606
  • мтДНК: H3f
23andme не тестирует всю митохондрию, а отдельные мутации и в итоге иногда ошибочно распределяет по субкладам. У меня самого не совпадает субклад H на FTDNA и 23andme, более достоверная информация на FTDNA.
Самое интересное,что посмотрел на субклады и что тот,который показал 23andme и те которые извлёк этот тест .связаны с Италией в основном, но H3f уж очень редкий..

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100