АвторТема: Стандарты файлов (VCF,BAM) и возможность заливки на сторонние ресурсы  (Прочитано 2328 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн modalАвтор темы

  • Сообщений: 15
  • Страна: ru
  • Рейтинг +2/-0
  • R-CTS3402
Так как поиск не работает по коротким словам пришлось создать тему иначе не разобраться.
Как я понимаю существуют разные стандарты файлов для выдачи результатов тестирования чаще всего не совместимые друг с другом.
Самые старые и универсальные я так понимаю .BAM и .VCF , самые распространенные сейчас форматы 23andme (у него ещё и версии разные V3-V5), Ancestry DNA, FamilyTreeDNA Family Finder и др.
Те кто разбирается, я так понял, могут как то конвертировать в ручную. Теперь вопросы от Новичка ;D

1. Допустим у меня VCF - Есть ли возможность конвертировать его в другие форматы при помощи онлайн системы или програмно в другие форматы? Существуют ли вообще конвекторы?
2. Конвертировал я файл в какой либо формат например 23andme или FF могу я залить его на эти сайты? В лоб не нашёл способа вроде как только через их наборы.
3. На какие сайты имеет смысл заливать данные вообще и какие форматы они переваривают. (Скорее всего данная инфа есть на форуме но она разрознена, хотелось бы создать мини FAQ, на эту тему, т.к. поиск коректно не работает)

Оффлайн NathanS

  • Сообщений: 1277
  • Страна: 00
  • Рейтинг +1202/-2
Так как поиск не работает по коротким словам пришлось создать тему иначе не разобраться.
Как я понимаю существуют разные стандарты файлов для выдачи результатов тестирования чаще всего не совместимые друг с другом.
Самые старые и универсальные я так понимаю .BAM и .VCF , самые распространенные сейчас форматы 23andme (у него ещё и версии разные V3-V5), Ancestry DNA, FamilyTreeDNA Family Finder и др.
Те кто разбирается, я так понял, могут как то конвертировать в ручную. Теперь вопросы от Новичка ;D

1. Допустим у меня VCF - Есть ли возможность конвертировать его в другие форматы при помощи онлайн системы или програмно в другие форматы? Существуют ли вообще конвекторы?
2. Конвертировал я файл в какой либо формат например 23andme или FF могу я залить его на эти сайты? В лоб не нашёл способа вроде как только через их наборы.
3. На какие сайты имеет смысл заливать данные вообще и какие форматы они переваривают. (Скорее всего данная инфа есть на форуме но она разрознена, хотелось бы создать мини FAQ, на эту тему, т.к. поиск коректно не работает)

BAM и VCF чаще истользуются для данных геномного секвенирования и создаются/используются бионформационными программами. BAM содержит наиболее полные данные секвенирования (все чтения, или почти) с выравниванием под референсный геном. BAM - большие файлы, 20-100 ГБ. VCF - текстовый формат для передачи данных в урезаном обьеме, только отличия от референсного генома. gVCF содержит все прочитанные основания, но эти файлы тоже довольно большие.

Форматы FTDNA, Ancestry, MyHeritage, 23andme, LivingDNA - это форматы для распространенных генеалогических тестов. Они сильно отличатся от BAM и VCF и содержат существенно меньше данных. Российский Genotek тоже выдает данные в виде VCF, но он мало пригоден, надо переводить данные в формат других компаний или выкупить данные в нужном формате.

1. Попробуйте WGSExtract http://dnagenics.com/adn/wgs-extract-by-marko-bauer/
2. 23andme и Ancestry не принимают загрузки данных. FTDNA, MyHeritage, GEDmatch и LivingDNA принимают данные других компаний. GEDmatch вроде принимает VCF, но результаты сравнения были печальные. gVCF мне не удалось залить на GEDmatch из-за размера. MyHeritage вроде берет и киты с WGSExtract. Как FTDNA принимает наборы из WGSExtract не знаю.
3. FamilytreeDNA.com (FTDNA) https://www.familytreedna.com/autosomal-transfer и myheritage.com (смотрите ДНК->Загрузить данные ДНК-теста) стоит залить. FTDNA и MyHeritage принимают результаты друг друга и в форматах Ancestry и 23andme. GEDmatch - раньше был хороший ресурс, сейчас сомнительный, много европейских совпаденцев оттуда сейчас пропало. GEDmatch принимает форматы FTDNA, MH, Ancestry, 23andme и VCF (VCF - не рекомендую). FTDNA можно подключить к дереву на geni.com, если у Вас там есть дерево - смотрите Partner Applications на сайте FTDNA. www.sequencing.com переваривает все, но наиболее интересен с BAM и/или VCF файлами. Там можно поработать с бионформационными программами и сделать интерпретации по здоровью, питанию, рекоммендациям стиля жизни ит .д. (бесплатно и платно).
« Последнее редактирование: 23 Декабрь 2019, 19:53:00 от NathanS »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.