АвторТема: Секвенирование экзома для диагностики заболеваний  (Прочитано 6504 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн IwannАвтор темы

  • Сообщений: 7
  • Страна: ua
  • Рейтинг +6/-0
Здравствуйте!

У моего ребенка диагностирована митохондриальная недостаточность, обусловленная видимо мутацией ядерного гена. Биохимические тесты на активность ферментов тут не всегда информативны. Генетические панели стоят дорого - от $10 000, я не потяну. Кандидаты для наших симптомов - около 50 генов.

С генетикой и биохимией, очень поверхностно, но знаком. Уважаемые форумчане, скажите пожалуйста, реалистична ли такая возможность - используя интернет-библиотеки и доступное ПО (UCSC Genome Browser, Integrative Genomics Viewer, OpenSNP) произвести поиск и обнаружить патогенный полиморфизм? Может быть вы в курсе, были такие примеры?

Думаю заказать кит секвенирования экзома с покрытием 80х в dnadtc.com или BGI.

Какие у меня могут возникнуть проблемы?

Очень буду рад любым соображениям.
« Последнее редактирование: 28 Октябрь 2013, 20:37:26 от Шад »

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6335
  • Страна: ru
  • Рейтинг +1333/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Посмотрите эту тему начиная с сообщения: http://forum.molgen.org/index.php/topic,2953.msg113429.html#msg113429

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6335
  • Страна: ru
  • Рейтинг +1333/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Кстати, а сколько стоит заказ напрямую в BGI?
Сейчас Full Genomes Corp планирует делать экзом за 700 долларов.
А 23andMe до сих пор делает за $999.

Оффлайн IwannАвтор темы

  • Сообщений: 7
  • Страна: ua
  • Рейтинг +6/-0
Я уже заказал на dnadtc.com за $900. Они предоставляют результаты в формате fasta.
Вот спецификация их метода http://www.dnadtc.com/pdf/exome_sequence.pdf
Но тем кто как и я - новичок в биоинформатике, наверное стоит попросить сделать выравнивание и получить vcf файл, это еще $100.
Аннотировать vcf и отфильтровать мутации можно в snpEff (под Cygwin) я уже попробовал некоторые функции на тестовых файлах - мне это кажется не очень сложной задачей даже для новичка.

Оффлайн IwannАвтор темы

  • Сообщений: 7
  • Страна: ua
  • Рейтинг +6/-0
Посмотрите эту тему начиная с сообщения: http://forum.molgen.org/index.php/topic,2953.msg113429.html#msg113429
Спасибо, изучаю...

Оффлайн IwannАвтор темы

  • Сообщений: 7
  • Страна: ua
  • Рейтинг +6/-0
Кстати, а сколько стоит заказ напрямую в BGI?
$2000  с каким-то медицинским отчетом.

If you need a detail annotation of the exome sequencing with detail explanation, for 80X coverage it is 2000 USD.

We will also tell you de novo mutation (mutation that is not been reported) and we have some unique database that we self-own to do analysis. We do have a story as attached that help this patient to find out why he is sick, this is the very first case that BGI cooperate with American Hospital. You can find our doctor, Dr. Ming Qi, mentioned in the news.

http://www.rickilewis.com/blog.htm?post=824227

Кстати, если заказывать сразу 20 китов и без отчета, то $700.

И цены будут снижаться, конечно...

Оффлайн Andymeon

  • Сообщений: 1179
  • Страна: ru
  • Рейтинг +119/-5
  • Y-ДНК: R1a [CTS 3402+ Y2910+ YP310+]
  • мтДНК: H3i
 Iwann, извините меня за такой вопрос, но каким образом у нас вообще диагностировали такое заболевание?
В чем оно выражается?
Я спросил на форуме не в личке, просто за тем что если сочтете вопрос некорректным, то можете меня проигнорировать.

Оффлайн IwannАвтор темы

  • Сообщений: 7
  • Страна: ua
  • Рейтинг +6/-0
Iwann, извините меня за такой вопрос, но каким образом у нас вообще диагностировали такое заболевание?
В чем оно выражается?
Я спросил на форуме не в личке, просто за тем что если сочтете вопрос некорректным, то можете меня проигнорировать.
Повышенный лактат в крови и характер нарушений, когда страдают в первую очередь энергоемкие органы. У нас типичный для митохондриальной недостаточности набор проблем (задержка психомоторного развития - мозг и нервная система очень много энергии требуют, гипотония - слабые мышцы у многих с митохондриальными заболеваниями, глухота - у очень многих, ЖКТ - почти у всех, судороги в анамнезе - у очень многих...).
В общем очень похоже, и наш генетик диагностировала.
« Последнее редактирование: 30 Июль 2013, 10:16:28 от Iwann »

Оффлайн IwannАвтор темы

  • Сообщений: 7
  • Страна: ua
  • Рейтинг +6/-0
Iwann, извините меня за такой вопрос, но каким образом у нас вообще диагностировали такое заболевание?
В чем оно выражается?
Я спросил на форуме не в личке, просто за тем что если сочтете вопрос некорректным, то можете меня проигнорировать.
Повышенный лактат в крови и характер нарушений, когда страдают в первую очередь энергоемкие органы. У нас типичный для митохондриальной недостаточности набор проблем (задержка психомоторного развития - мозг и нервная система очень много энергии требуют, гипотония - слабые мышцы у многих с митохондриальными заболеваниями, глухота - у очень многих, ЖКТ - почти у всех, судороги в анамнезе - у очень многих...).
В общем похоже, и наш генетик диагностировала.

Модератор: исправлены теги.
« Последнее редактирование: 30 Июль 2013, 10:31:19 от пенелопа »

Оффлайн Andymeon

  • Сообщений: 1179
  • Страна: ru
  • Рейтинг +119/-5
  • Y-ДНК: R1a [CTS 3402+ Y2910+ YP310+]
  • мтДНК: H3i
Где то видел ссылку на секвенирование экзонов в 23andme, найти не могу, кто подскажет ?

Оффлайн Andymeon

  • Сообщений: 1179
  • Страна: ru
  • Рейтинг +119/-5
  • Y-ДНК: R1a [CTS 3402+ Y2910+ YP310+]
  • мтДНК: H3i

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6335
  • Страна: ru
  • Рейтинг +1333/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Нашел https://www.23andme.com/exome/

Основная тема для обсуждения секвенирования экзома в 23andMe: http://forum.molgen.org/index.php/topic,2953.0.html

Оффлайн IwannАвтор темы

  • Сообщений: 7
  • Страна: ua
  • Рейтинг +6/-0
Может быть лучше назвать тему "Секвенирование экзома для диагностики заболеваний"?

Делюсь своей подборкой информации на англ. языке о секвенировании экзома для диагностики редких заболеваний
Подборка для тех кто с нуля сам захочет разобраться.

Хорошая статья о значении и смысле самого секвенирования:
http://www.biorigami.com/wp-content/uploads/2011/10/what-can-exome-sequencing-do-for-you.pdf

Понимание структуры VCF файла:
1) http://gatkforums.broadinstitute.org/discussion/1268/how-should-i-interpret-vcf-files-produced-by-the-gatk
2) http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3137218/
3) http://www.1000genomes.org/wiki/Analysis/Variant%20Call%20Format/vcf-variant-call-format-version-41

Классный обзор современных программных инструментов для подготовки, визуализации и анализа данных секвенирования:
http://bib.oxfordjournals.org/content/early/2013/01/21/bib.bbs086.full
Проведен сравнительный анализ программ по группам. Кстати, большая часть программ - бесплатные.

Наиболее популярное и развитое программное обеспечение для аннотирования VCF файла:
http://snpeff.sourceforge.net/
http://www.openbioinformatics.org/annovar/
Эти программы не связаны и могут использоваться по отдельности. Я немного разобрался с snpEff. Работают они под Linux или на эмуляторе Unix под Windows. Например, я пользуюсь Cygwin http://www.cygwin.com/
Для знакомства с программами нужно установить Linux или эмулятор, установить их согласно инструкции и разобраться в работе с командной строкой на примере тестового VCF файла. Все это не очень просто. Поэтому стоит обратиться за помощью к тому, кто работает с Linux.

В принципе, есть еще один путь - аннотирование файла на сервере. Например здесь: http://gvsbatch.gs.washington.edu/SeattleSeqAnnotation137/index.jsp
По этой ссылке можно загрузить неаннотированный VCF файл и получить его в пригодном для анализа в Excel виде (через час после загрузки тестового файла пришла ссылка, что можно выкачать назад). По-моему неплохо справляется.
По некоторым полиморфизмам, которые в исходном VCF файле выглядят так:

Цитировать
#CHROM   1
POS   9323910
ID   rs6688832
REF   G
ALT   A
QUAL   .
FILTER   PASS
INFO   NS=1;DP=49;AF=1.000;ANNOT=CDS;REFAA=R;AAC=Q;GI=H6PD;TI=NM_004285.3;PI=NP_004276.2
FORMAT   GT:DP:EC:CONFS
Job1.pjt   1/1:49:49:13.100,13.200,1.000,1.000,1.000,1.000,1.000

Получаются, например, такие аннотации:

Цитировать
inDBSNPOrNot   dbSNP_116
chromosome   1
position   9323910
referenceBase   G
sampleGenotype   A
sampleAlleles   A/A
allelesDBSNP   A/G
accession   NM_004285.3
functionGVS   missense
functionDBSNP   missense
rsID   6688832
aminoAcids   ARG,GLN
proteinPosition   453/792
cDNAPosition   1358
polyPhen   0.001
granthamScore   43
scorePhastCons   0.054
consScoreGERP   -2.120
chimpAllele   A
CNV   8,31648E+18
geneList   H6PD
AfricanHapMapFreq   17.1
EuropeanHapMapFreq   41.328
AsianHapMapFreq   46.5
hasGenotypes   yes
dbSNPValidation   by-frequency
repeatMasker   none
tandemRepeat   none
clinicalAssociation   http://www.ncbi.nlm.nih.gov/sites/varvu?gene=9563&rs=6688832|http://www.ncbi.nlm.nih.gov/omim/138090,604931|http://omim.org/entry/138090#0002
distanceToSplice   343
microRNAs   none
genomesESP   A=3988/G=9018

Но SeattleSeq Annotation не такой мощный, как упомянутые Linux-приложения и согласно обзору, на который я ссылался выше: "the tool might be interesting for research groups without dedicated hardware for data analysis".
Есть и другие веб-анализаторы, но я не вникал.

Если есть подозрения на конкретные заболевания, то имеет смысл в первую очередь проверить гены из панелей, которые предлагают молекулярные лаборатории. Например, здесь, большой список заболеваний и ответственных за них генов:
http://www.genedx.com/test-catalog/disorders/

Хорошая статья о стратегии поиска генов-кандидатов для заболевания:
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3330229/
Надеюсь, я когда-нибудь буду понимать все, что там написано :)
Кстати, в библиотеке можно найти еще множество разных статей по теме:
http://www.ncbi.nlm.nih.gov/pmc/?term=Exome+sequencing
Еще презентация по стратегии:
http://www.nbic.nl/uploads/media/09_variant_interpretation_for_diagnostics.pdf

Популярная статья, может пригодиться, как чей-то опыт:
http://jchoigt.wordpress.com/2012/07/18/working-with-23andme-exome-data-my-cf-allele-and-the-need-for-verification/
Правда, у меня не работала описанная там программа для визуализации генетической информации, но есть  и другие. Большинство из них бесплатные. Здесь список:
http://en.wikipedia.org/wiki/Genome_browser
У меня, например, работает Golden Helix Genome Browser - http://www.goldenhelix.com/GenomeBrowse/
Программы визуализации - интересная штука, но, видимо, они не особенно важны при медицинском анализе. Я так понимаю, лучше экспортировать отфильтрованные данные в Excel и работать с ними в табличной форме.

Интересный блог - реальные примеры из опыта анализа данных и стратегии поиска патогенных мутаций:
http://gtbinf.wordpress.com/

Для продвинутых пользователей - форум по биоинформатике:
http://seqanswers.com/forums/index.php
Но это, как по мне, «высший пилотаж», т.к. понимаю очень малую часть из обсуждаемого.

Буду рад дополнением и конструктивной критике, т.к. я пока "чайник" в этой теме.
« Последнее редактирование: 04 Ноябрь 2013, 14:50:25 от Iwann »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.