Если у кого-то как у меня не грузятся данные из Генотека (формат vcf или 23andMe) в FamilyTreeDna из-за каких-то их новых ограничений, то вот что мне помогло после двух недель мучений:
1) Открываю файл Генотека (оригинальный VCF) в Excel, указываю что разделитель табуляция, импортирую все столбцы
2) Удаляю лишние первые строки, оставляя только результаты
3) сортирую так, как требует ftdna:
rsid chromosome position allele1 allele2
4) заменяю имя хромосом, где написано "chr1" удаляя заменой "chr", тем самым остаются только цифры хромосом.
5) дальше работа с фильтрами: удаляю все значения где указано больше одного ACTG, все значения должны быть только по 1 букве
6) удаляю все пустые или непонятные значения отовсюду строчками прямо, включая 0-0 и --
7) удаляю те rsid в которых присутствует несколько значений разделённых знаком ";"
8) исправляю название хромосом:
генотековские значения для Y хромосомы исправляю "Y" на "23"
генотековские значения для X хромосомы исправляю "X" на "24"
генотековские значения для Mt хромосомы исправляю "Mt" на "26"
9) экспортирую всё в txt файл разделённый пробелами, предварительно отсортировав строки по столбцу хромосом
10) открываю блокнотом и добавляю в начало файла:
#AncestryDNA raw data download
#This file was generated by AncestryDNA at: 09/26/2023 23:47:04 UTC
#Data was collected using AncestryDNA array version: V2.0
#Data is formatted using AncestryDNA converter version: V1.0
#Below is a text version of your DNA file from Ancestry.com DNA, LLC. THIS
#INFORMATION IS FOR YOUR PERSONAL USE AND IS INTENDED FOR GENEALOGICAL RESEARCH
#ONLY. IT IS NOT INTENDED FOR MEDICAL, DIAGNOSTIC, OR HEALTH PURPOSES. THE EXPORTED DATA IS
#SUBJECT TO THE ANCESTRY TERMS AND CONDITIONS, BUT PLEASE BE AWARE THAT THE
#DOWNLOADED DATA WILL NO LONGER BE PROTECTED BY OUR SECURITY MEASURES.
#WHEN YOU DOWNLOAD YOUR RAW DNA DATA, YOU ASSUME ALL RISK OF STORING,
#SECURING AND PROTECTING YOUR DATA. FOR MORE INFORMATION, SEE ANCESTRYDNA FAQS.
#
#Genetic data is provided below as five TAB delimited columns. Each line
#corresponds to a SNP. Column one provides the SNP identifier (rsID where
#possible). Columns two and three contain the chromosome and basepair position
#of the SNP using human reference build 37.1 coordinates. Columns four and five
#contain the two alleles observed at this SNP (genotype). The genotype is reported
#on the forward (+) strand with respect to the human reference.
rsid chromosome position allele1 allele2
------ в последней строчке между rsid и chromosome и далее не пробелы а табуляция
11) сохраняю, архивирую в zip, загружаю.
12) если не принимает файл всё равно, то открываю в DnaStudio 2.9 и конвертирую используя шаблон Ancestry v2, после чего снова в блокноте открываю и добавляю указанную выше шапку, снова в архив - так сработало.