Mich Glitch, я ничего не понял, но лично у меня 6.х Мбайт занимают файлы протестированных в FTDNA и скачанные с сайта FTDNA в любой версии,36 или 37.
А 7.x Мбайт - файл протестированного меня переведенные из 23andMe в формат FTDNA и скачанные с сайта FTDNA, снова в любой версии.
Рискну предположить, что панель SNP у каждой лаборатории строго определённая, поэтому файл должен включать все SNP, которые есть на чипе и не включать те, которых на чипе нет. Соответственно, если в файле --, то данные должны быть, но по каким-то причинам не прочитаны. Если данные никто не собирался читать, то и в файле не будет информации о них. Ни к чему.
Распределение размеров файлов примерно на две группы может быть из-за:
1. Файлы большего размера получены трансфером из 23andMe, меньшего - оригинальные файлы FTDNA.
2. Разные версии чипов FTDNA. Я читал, что каждый год немного (или много) меняется набор снипов.
3. Архиватор чудит. Заметьте, кстати, что файл X-хромосома + аутосомы всегда больше, чем сумма файлов с X-хромосомой и аутосомами. Хотя должно быть наоборот, ведь данные одинаковые, но в двух файлах два заголовка, а в одном - один. Загадка...
Я чувствую, что спор идёт по-поводу какого-то элементарного вопроса, но не могу поймать нить рассуждений.
Mich Glitch, по поводу rs10797423 у китов 277811 и 277812 могу предположить следующее объяснение. В данной точке no calls, но не из-за ошибки чипа, а из-за того, что такого снипа у тестируемого просто нет. Предполагаю по аналогии с mtDNA, которая разной длины может быть из-за того, что некоторые у кого-то снипы выпадают. Но это предположение, естественно.
Mich Glitch, расскажите, пожалуйста, подробнее про киты 277811 и 277812. Вы писали, что пробирки от одного человека случайно попали в два разных теста. У вас было четыре пробирки с ДНК одного человека или в каждом наборе было по две пробирки от разных людей? Непонятно.
Mich Glitch, вы сами с этим вопросом разобрались и нам сейчас пытаетесь объяснить? Если нет, то могу попробовать как-нибудь какую-нибудь утилиту сделать, которая бы сравнила два ваших файла и выдала вам статистику несовпадений. Сами файлы не нужны. Вы только скажите, что именно хотите получить. Если да, то объясните уже, наконец, что происходит!:)