АвторТема: Качество аутосомного теста для генеалогии  (Прочитано 241 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mikl1984Автор темы

  • R1b R-BY1823 H2a1
  • Сообщений: 157
  • Страна: ru
  • Рейтинг +50/-0
В этом году сделал несколько тестов для себя и родственников
Компании выбирались сначала наобум (Генотек, MyHeritage), потом более осознанно (FTDNA)
Получив свои результаты от всех, пробовал их интерпретировать
Быстро понял, что для этники вся троица не сильно подходит :( , при чем Генотек хуже всех https://isogg.org/wiki/Admixture_analyses
При чем это было и в прошлые годы, когда он выдавал 600K снипов, в этом году новое дно - 500К

Итак как оцениваем. По методике isogg. Используем https://dnagenics.com/admixture-studio/ для тестов
Прога пишет количество используемых снипов для расчета
Вот результат моего теста FTDNA для K13
SNPs used for the calculation: 77 968
SNPs in calculator: 182 705
Genotype ratio: 42,67%

А это мой ущербный Genotek
SNPs used for the calculation: 52 361
SNPs in calculator: 182 705
Genotype ratio: 28,66%

Тоже самое проделываем для K36, который повсеместно используется для симуляции координат в G25
Очень похожая картинка
FTDNA
SNPs used for the calculation: 72 180
SNPs in calculator: 165 688
Genotype ratio: 43,56%
MH
SNPs used for the calculation: 72 426
SNPs in calculator: 165 688
Genotype ratio: 43,71%
Г...
SNPs used for the calculation: 46 166
SNPs in calculator: 165 688
Genotype ratio: 27,86%

Как еще можно оценить качество теста?
Через количество и качество совпаденцев
В этом году MH перестал принимать сторонние тесты :(
Остаются ftdna, gedmatch, genotek и familio
Все используют свои сеты снипов и алгоритмы, но думаю, методику можно придумать
Также надо учитывать импьютинг, сейчас вижу, что его в этом году начали использовать и Генотек (из-за плохого качества считывания с чипа) в своем vcf и MH с августа (возможно в связи с подготовкой близкого перехода на 2x WGS)

Из самого простого можно смотреть на число используемых снипов в gedmatch, раз все так любят сравнивать свои киты там
Само собой смотрим и на количество совпаденцев
Это мой vcf, конвертированный в формат 23&me
Number of original snps is 493304
Usable SNPS is 447218
Usable SNPS (slim) is 365734
Slimmed by 18.2 Pct.
HeteroX: 0.012194
Total matches for all kits in Database: 4718681384768
Total matches with kit KH??????? = 736818 = 1.5614913148798E-5 Pct. of all matches in the entire GEDmatch database

A вот покупной импьют в V5
Number of original snps is 628790
Usable SNPS is 493233
Usable SNPS (slim) is 395157
Slimmed by 19.9 Pct.
HeteroX: 0.033581
Total matches for all kits in Database: 4718681384768
Total matches with kit RJ???????? = 221630 = 4.6968629989604E-6 Pct. of all matches in the entire GEDmatch database

Совпаденцев уже в 3 с лишним раза меньше
Его приняли, но лжесовпаденцев все равно почти в 2 раза больше, чем дает файл ftdna
Number of original snps is 615633
Usable SNPS is 487926
Usable SNPS (slim) is 382150
Slimmed by 21.7 Pct.
HeteroX: 0
Total matches for all kits in Database: 4827639210496
Total matches with kit NZ????????= 125082 = 2.5909558387887E-6 Pct. of all matches in the entire GEDmatch database

Вообщем, приглашаю к обсуждению со своими мыслями
Я пока заказал WGS 30x  и Ancestry для полноты картины

Оффлайн Древ

  • Сообщений: 1105
  • Страна: ru
  • Рейтинг +313/-4
  • Y-ДНК: I-PH1410
  • мтДНК: H5a1a*
Re: Качество аутосомного теста для генеалогии
« Ответ #1 : 08 Ноября 2025, 22:07:29 »
Количество фейковых совпаденцев из этнофона едва ли может быть критерием оценки.
реальным критерием может быть настоящий дальний родственник, которого один сервис оценивает, например, в 5сМ, а другой в 10сМ. Вот это было бы важно.

Оффлайн Mikl1984Автор темы

  • R1b R-BY1823 H2a1
  • Сообщений: 157
  • Страна: ru
  • Рейтинг +50/-0
Re: Качество аутосомного теста для генеалогии
« Ответ #2 : 15 Ноября 2025, 17:53:17 »
реальным критерием может быть настоящий дальний родственник, которого один сервис оценивает, например, в 5сМ, а другой в 10сМ. Вот это было бы важно.
Это другой вопрос
Все сервисы оценят один и тот же тест по разному из-за разных панелей и алгоритмов

У меня задача оценить качество тестов из разных компаний, лучше на независимых площадках
Г... нельзя использовать, так как он уравнивает и количество совпаденцев и cM для разных тестов одного человека
Остаются ftdna и gedmatch, т.к. familio пока не показывает детали по совпадающим участкам на хромосомах

Например, в gedmatch есть 3 моих кита: из ftdna, импьют V5 из Генотек и свежий MH с импьютом
Также есть тесты моих детей в MH в доимпьютную эру полгода назад для контроля
Даже при их сравнении видно и качество импьюта, а оно отвратное у г... из-за малого числа считанных с чипа снипов
Попеременно сравниваем эти 3 теста и убеждаемся, что ftdna лучше всех, MH чуть хуже, г... на своём месте
На аутосомах разница небольшая, например при сравнении с ftdna видим 3576-3508/151, а вот на сильно импьютированном X она разительна 184-70/89-19


« Последнее редактирование: 15 Ноября 2025, 17:59:35 от Mikl1984 »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.