АвторТема: Кто с твоими патогенными вариантами? Общие сегменты на MyHeritage ответят.  (Прочитано 581 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн R1a1a1b1a2a1Автор темы

  • Сообщений: 80
  • Страна: ru
  • Рейтинг +24/-0
  • Y-ДНК: R1a1a1b2a2a1c2 Y20653 или YP569
  • мтДНК: H2a2a1
Родственников показывает, у которых такие же варианты (риски, патогенные, вероятно патогенные), как у тебя. Чем-то напоминает такие атаки, но в белой шляпе:
https://pcr.news/novosti/ataka-lozhnykh-rodstvennikov-mozhet-vzlomat-geneticheskie-servisy/
https://elifesciences.org/articles/51810

Поскольку MyHeritage позволяет сохранять как CSV-файлы диапазоны общих сегментов, по ним можно пройтись такими циклами в bash (однострочники скопировать в терминал):

for f in ../Shared_DNA_segments/*csv;do awk -F, '!/SNPs/{print "cat chip.vcf|grep -w ^chr"$3"|awk :$2>"$4" && $2<"$5":"}' $f|tr : "'" |bash|tee $f.vcf;done

for s in ../Shared_DNA_segments/*vcf;do echo $s;for n in X Y {1..22};do echo ______$n;awk '$NF~/1/' $s|grep -w ^chr$n|awk '{print $2$5,substr($NF,1,3)}' >tmp;grep -w ^$n clinvar_20200127.vcf|awk '$5==substr($5,1,1)'|awk '/athog/||/risk/{print $2$5,$8}'|awk -FCLNDN= '{print substr($1,1,14),$2}'|cut -d\; -f1|awk '{print $1,$3}'|sed 's/not_specified//g' >Pathog;awk 'FNR==NR{a[$1];next}($1 in a)' <(sort tmp) <(sort Pathog)|tr \; \\n;echo;done|tee $s.log;done
chip.vcf генотековский в примере, но принципиальных отличий от других форматов нет (номера полей достаточно поправить в скрипте).
Вывод примерно такой:
../Shared_DNA_segments/Shared_DNA_segments_of_N_N_and_Alice_Ujanen-Sipola.csv.vcf
...
______20
4680251G Alzheimer_disease,_early-onset,_susceptibility_to|Aphasia,_primary_progressive,_susceptibility_to|Prion_disease,_susceptibility_to|Genetic_prion_diseases|Huntington_disease-like_1|
7106289C Craniosynostosis_7

______21

______22
clinvar_20200127.vcf отсюда ftp://ftp.ncbi.nlm.nih.gov/pub/clinvar/vcf_GRCh37/ Ограничения базы Clinvar при оценке патогенности варианта известны, здесь привожу только в качестве примера (можете подставить свой список интересующих мутаций).
Код портативный, можно запускать хоть на мобильнике с Андроидом.

Каков био-медицинский смысл поиска родственников с твоей мутацией? Патогенность подтвердить или опровергнуть помогает. Пенетрантность оценить, если много родственников носители без симптомов. Всего родственников на MyHeritage более 6000-2000. Среди родни выше вероятность встретить носителя мутации, по сравнению с общепопуляционной выборкой. Семейный анамнез собирать принято у врачей-генетиков, но если дальше дедушек никого в семье не знаешь, то 4-8 поколений это хорошее расширение, поскольку выше вероятность найти носителя с твоей мутацией в гомозиготном состоянии (или с манифестировавшим доминантным, кодоминантным типами наследования), чем по устной семейной легенде и по медкартам знакомых родных. Думаю врачи оценят такой инструмент, особенно разбирающиеся в генетике чуть лучше, чем после курса в медвузе.

« Последнее редактирование: 18 Февраль 2020, 01:52:47 от R1a1a1b1a2a1 »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.