Здесь я не совсем понимаю логики. На входе мы имеем парную абракадабру, а на выходе - 2 реальных гаплотипа достаточно большой длины 400. Причем в регионах бедных на рекомбинацию это будут вполне нормальные такие аллели, с филогенией и происхождением, с возможностью выяснить географию. Чем это плохо? А уж выяснять от кого это пришло - ну для этого по любому надо иметь достаточный набор родственников с обеих сторон, иначе никак. Я бы без такого плотного набора тестируемой родни не брался бы за выяснение данного вопроса. Другое дело - это когда мы нашли совпаденца со всеми 400 или хотя бы с 100 позициями. Но для этого нужен более мощный чип хорошо покрывающий участки с малой рекомбинацией, то есть чип специально сдизайненный для генеалогии.
Читаю эту дискуссию и получаю несказанное удовольствие от комментариев действительно умного и сведущего человека.
За что Валерию особая личная благодарность от меня.Действительно, многие проблемы 23ия с предиктованием генеалогического родства обусловленны не несовершенством методов обработки данных, а скорее, недостатками модифицированного Иллюмина чипсета. Соврешенно ясно (даже при простом взгляде на геномный браузер HapMap) что плотность snp/kB (число снипов на килобазу) или snp/cM (снипов на сентиморган) далеко неодинакова в разных регионах генома и на разных сегментах хромосом. Далее, тот же проект ХапМап произвел достаточно надежное картирование хотспотов (горячих участков рекомбинации) для каждой из хромосом (и с каждой новой фазой проекта эта картирование становится все более точным).
Наличие хостпотов и неравномерная плотность
выявленных снипов существенно затрудняет поиск устойчивых гаплоблоков (которые и опредляется в результате фазирования). А неравномерная плотность и что еще хуже отсутствие многих Хапмаповских снипов в чипсетах, используемых FTDNA и 23andme (кстати чипсет Decodeme - в отличие от чипсетов FTDNA и 23andme- наиболее близок к 1,5-млн чипсету HapMap) приводит к появлению искуственных УПС. Если не ошибаюсь, Леон, который занимался слияниям снипов FTDNA и 23ия, приводил примеры, когда после слияния данных УПСЫ (выявленные в отдельности по результатам снип-тестирования FTDNA и в 23ия) просто
ломались, поскольку внутри участка который воспринимался, к примеру в 23ия, как непрерывная цепочка половинного совпадения (HIR-сегмент) вклинивался снип, нарушавший гармоничную последовательность.
А теперь представьте что будет с этими HIR-сегментам после того как будут протестированны миллион или полторамиллиона снипов? А что будет тогда, когда будет секвенсирован полный геном?