АвторТема: YFULL.com - Интерпретация вашего полного сиквенса mtDNA  (Прочитано 107703 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Farroukh

  • Maternal Y-DNA: R1b-FTD83033
  • ...
  • Сообщений: 18974
  • Страна: az
  • Рейтинг +7135/-18
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Как уже отметил коллега, там возможен только полный мито-секвенс. Ancestry теперь выдаёт только аутосомные результаты, без гаплогрупп. 23AndMe выдаёт поверхностный мито-результат.

Оффлайн Mikl1984

  • R1b R-BY1823 R-FTA13144
  • Сообщений: 298
  • Страна: ru
  • Рейтинг +83/-0
  • H2a1f4
Возможно ли заказать интерпретацию мтДНК сиквенса в компании YFull, если исходные данные получены в Ancestry или 23AndMe? У меня есть файлы с исходными данными, но они по весу гораздо больше, чем нужно.
тут китайцы помогут, они вычисляют мито из этих файлов https://www.theytree.com/mttree/
Но вряд ли дадут глубже, чем вам уже дали
Совет про WGS поддерживаю, узнаете все про здоровье заодно

Оффлайн Mikl1984

  • R1b R-BY1823 R-FTA13144
  • Сообщений: 298
  • Страна: ru
  • Рейтинг +83/-0
  • H2a1f4
Подтверждаю проблему считывания мито из t2t bam, упомянутую Randy
https://forum.molgen.org/index.php/topic,5782.msg625392.html#msg625392
Мой пример - не считано 2 снипа
Covered regions:   1-9100, 9102-16569   
All covered bp:   16567 from 16569   
No covered bp:   2 from 16569
Удивительно было это увидеть при 3000х считываний
Если смотреть fasta из hs37, то все на месте

Стоит связаться с поддержкой и дать ей нормальный fasta?

Оффлайн AleksG

  • Maternal Y-DNA: R-L365->R-Y596405
  • Сообщений: 1577
  • Страна: 00
  • Рейтинг +678/-6
  • Y-ДНК: Q-PH2513
  • мтДНК: U5a1a1a5
У меня такая же проблема на fasta от фулл мито ftdna:

Covered regions:   1-9023, 9025-16569   
All covered bp:   16567 from 16569   
No covered bp:   2 from 16569   
Diffs from RSRS:   57   
Diffs from rCRS:   36   
Private mutations count:   0

Оффлайн Mikl1984

  • R1b R-BY1823 R-FTA13144
  • Сообщений: 298
  • Страна: ru
  • Рейтинг +83/-0
  • H2a1f4
Это другое
Ftdna и Г... специально исключают снипы из fasta

У жены fasta из Tellmegen считан полностью
Covered regions:   1-16569   
All covered bp:   16569 from 16569   
No covered bp:   0 from 16569   
Diffs from RSRS:   59   
Diffs from rCRS:   49   
Private mutations count:   2

Если бы я дал yfull fasta, был бы тот же 100% результат

Возможно, это ошибка pipeline yfull
Китайцы из dnachron рапортуют, что они считали из t2t bam 100% мито, правда пока это непроверяемо
CRAM File Size   5.5MB
Base Length Covered   16569
Coverage   100%
Average Depth   3466.39x
Average Read Length   150
raw total sequences   385830
reads mapped   385345
reads properly paired   378204



Оффлайн Tora_sama

  • Сообщений: 1082
  • Страна: ru
  • Рейтинг +555/-0
  • Y-ДНК: E-FTB75628
  • мтДНК: H1b2g
У меня проблем нет, но это декабрь 22 года FTDNA.
Covered regions:   1-16569   
All covered bp:   16569 from 16569   
No covered bp:   0 from 16569   
Diffs from RSRS:   49   
Diffs from rCRS:   20   
Private mutations count:   0

Оффлайн Mikl1984

  • R1b R-BY1823 R-FTA13144
  • Сообщений: 298
  • Страна: ru
  • Рейтинг +83/-0
  • H2a1f4
Написал в поддержку и получил ответ
Цитировать
Для анализа митохондриальной ДНК принципиальной разницы между выравниванием на T2T и hs37d5 нет, поскольку митохондриальный геном в обоих случаях основан на rCRS и далее интерпретируется относительно rCRS/ RSRS.
Отсутствие отдельных SNP в BAM-файле не означает его повреждение.
Возможными причинами могут быть, например, недостаточное покрытие в конкретных позициях либо гетероплазмия.
В частности, в позиции 9101 наблюдается нечистое покрытие (одновременно
присутствуют несколько вариантов прочтения).
Если вы укажете конкретные позиции, по которым считаете, что SNP должны
присутствовать в данном образце, я перепроверю наш результат.

Ответил
Цитировать
На болезни Николая II не претендую ;)
Посмотрите плиз подробнее на 9101
У еще какой снип не считался?
А то по вашей инфе это не понятно
Covered regions:   1-9100, 9102-16569   
All covered bp:   16567 from 16569   
No covered bp:   2 from 16569
На всякий случай в аттаче fasta из сборок hs37 и hs38
Тоже отличаются на пару байт
И загрузил тот же t2t bam на mitoverse
mtDNA-Server 2 нашел 5 heteroplasmies and 22 InDels:
clustered_events;haplotype;map_qual;strict_strand   6
clustered_events;haplotype   16
9101 (T>C) без проблем
Посмотрим, что Юлия напишет

Оффлайн Mikl1984

  • R1b R-BY1823 R-FTA13144
  • Сообщений: 298
  • Страна: ru
  • Рейтинг +83/-0
  • H2a1f4
Посмотрел последний месяц за обновлениями дерева
Немного офигел от их количества
1.02.23728 (30 Декабрь 2025)
1.02.23732 (07 Январь 2026)
1.02.23737 (12 Январь 2026)
1.02.23757 (19 Январь 2026)
1.02.23768 (23 Январь 2026)
1.02.23779 (27 Январь 2026)
1.02.23783 (29 Январь 2026)
Может пропустил еще какие
Думал, что последние цифры просто количество образцов, но подсчеты ранее https://forum.molgen.org/index.php/topic,16267.msg623632.html#msg623632 это опровергают, их меньше добавляется


Оффлайн Mikl1984

  • R1b R-BY1823 R-FTA13144
  • Сообщений: 298
  • Страна: ru
  • Рейтинг +83/-0
  • H2a1f4
Продолжаю неторопливо переписываться с Юлией
Почему то никто в теме не написал про 3107
А он связан с подсчетом пропущенных снипов
Цитировать
Поясню, откуда в этом отчёте берётся значение No covered bp: 2 и почему в других образцах статистика может выглядеть иначе.
В rCRS используется исторически сохранённая позиция 3107 (3107del), которая помечена в референсе как N. Это референсная особенность, не соответствующая реальному нуклеотиду, и сама по себе она не отражает проблему покрытия образца. Поэтому в образцах без других непрочитанных позиций 3107 не включается в summary-статистику.
В данном образце при этом присутствует одна реально непокрытая позиция — 9101, что видно по разрыву в covered regions. Когда в образце есть хотя бы один такой реальный пропуск, summary-статистика показывает полное количество координат без A/C/G/T, и в счёт попадает также и позиция 3107. Отсюда и получается 2 uncovered bp.


 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.