Так как поиск не работает по коротким словам пришлось создать тему иначе не разобраться.
Как я понимаю существуют разные стандарты файлов для выдачи результатов тестирования чаще всего не совместимые друг с другом.
Самые старые и универсальные я так понимаю .BAM и .VCF , самые распространенные сейчас форматы 23andme (у него ещё и версии разные V3-V5), Ancestry DNA, FamilyTreeDNA Family Finder и др.
Те кто разбирается, я так понял, могут как то конвертировать в ручную. Теперь вопросы от Новичка
1. Допустим у меня VCF - Есть ли возможность конвертировать его в другие форматы при помощи онлайн системы или програмно в другие форматы? Существуют ли вообще конвекторы?
2. Конвертировал я файл в какой либо формат например 23andme или FF могу я залить его на эти сайты? В лоб не нашёл способа вроде как только через их наборы.
3. На какие сайты имеет смысл заливать данные вообще и какие форматы они переваривают. (Скорее всего данная инфа есть на форуме но она разрознена, хотелось бы создать мини FAQ, на эту тему, т.к. поиск коректно не работает)
BAM и VCF чаще истользуются для данных геномного секвенирования и создаются/используются бионформационными программами. BAM содержит наиболее полные данные секвенирования (все чтения, или почти) с выравниванием под референсный геном. BAM - большие файлы, 20-100 ГБ. VCF - текстовый формат для передачи данных в урезаном обьеме, только отличия от референсного генома. gVCF содержит все прочитанные основания, но эти файлы тоже довольно большие.
Форматы FTDNA, Ancestry, MyHeritage, 23andme, LivingDNA - это форматы для распространенных генеалогических тестов. Они сильно отличатся от BAM и VCF и содержат существенно меньше данных. Российский Genotek тоже выдает данные в виде VCF, но он мало пригоден, надо переводить данные в формат других компаний или выкупить данные в нужном формате.
1. Попробуйте WGSExtract
http://dnagenics.com/adn/wgs-extract-by-marko-bauer/2. 23andme и Ancestry не принимают загрузки данных. FTDNA, MyHeritage, GEDmatch и LivingDNA принимают данные других компаний. GEDmatch вроде принимает VCF, но результаты сравнения были печальные. gVCF мне не удалось залить на GEDmatch из-за размера. MyHeritage вроде берет и киты с WGSExtract. Как FTDNA принимает наборы из WGSExtract не знаю.
3. FamilytreeDNA.com (FTDNA)
https://www.familytreedna.com/autosomal-transfer и myheritage.com (смотрите ДНК->Загрузить данные ДНК-теста) стоит залить. FTDNA и MyHeritage принимают результаты друг друга и в форматах Ancestry и 23andme. GEDmatch - раньше был хороший ресурс, сейчас сомнительный, много европейских совпаденцев оттуда сейчас пропало. GEDmatch принимает форматы FTDNA, MH, Ancestry, 23andme и VCF (VCF - не рекомендую). FTDNA можно подключить к дереву на geni.com, если у Вас там есть дерево - смотрите Partner Applications на сайте FTDNA.
www.sequencing.com переваривает все, но наиболее интересен с BAM и/или VCF файлами. Там можно поработать с бионформационными программами и сделать интерпретации по здоровью, питанию, рекоммендациям стиля жизни ит .д. (бесплатно и платно).