АвторТема: HG19 HG38 build 37  (Прочитано 360 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн sergey_mАвтор темы

  • Сообщений: 3
  • Страна: ru
  • Рейтинг +0/-0
HG19 HG38 build 37
« : 18 Июль 2022, 12:15:03 »
Несколько раз сталкивался с некими "стандартами" или расшифровками HG19, HG38 и ещё reference human assembly build 37. Как всё это на русском называется и чем отличается? Например, у меня в файле VCF написано HG19 а в 23andme написано build 37. На GEDMatch я могу выбирать B36, B37 и B38.

В то же время, например тут (некто имеющий со мной что-то общее) https://www.ytree.net/SNPinfoForPerson.php?personID=7220 я вижу есть и H19 и HG38

Что всё это такое, чем отличается и как во всём этом разобраться? Есть ли какой-то ликбез где-то?

Оффлайн NathanS

  • Сообщений: 840
  • Страна: 00
  • Рейтинг +665/-2
Re: HG19 HG38 build 37
« Ответ #1 : 18 Июль 2022, 12:41:00 »
Несколько раз сталкивался с некими "стандартами" или расшифровками HG19, HG38 и ещё reference human assembly build 37. Как всё это на русском называется и чем отличается? Например, у меня в файле VCF написано HG19 а в 23andme написано build 37. На GEDMatch я могу выбирать B36, B37 и B38.

В то же время, например тут (некто имеющий со мной что-то общее) https://www.ytree.net/SNPinfoForPerson.php?personID=7220 я вижу есть и H19 и HG38

Что всё это такое, чем отличается и как во всём этом разобраться? Есть ли какой-то ликбез где-то?

Называется "Референсный геном". 36, 37, 38 - номер версии. Последняя версия 38: GRCh38, HG38, build 38. HG19 - это GRCh37 или build 37. 36 уже не используется.
https://en.wikipedia.org/wiki/Reference_genome

https://habr.com/ru/company/atlasbiomed/blog/479602/
Цитировать
Образовательный блок 2
Референсный геном — это искусственно собранная последовательность ДНК биологического вида. Большинство последовательностей, из которых собран референсный геном человека, были взяты у одного человека Африкано-Европейского происхождения. Референсный геном регулярно обновляется: последняя версия, GRCh38, была выпущена в 2013 году и содержит в себе 3,3 млрд нуклеотидов. Несмотря на доступность новой версии, многие генетические тесты и сервисы по анализу генетических данных используют предыдущую — GRCh37. Для предоставления наиболее точных результатов анализа Атлас использует версию GRCh38.

Самостоятельно, как правило, не работают с файлами. Для информации о здоровье достаточно информации компании или интерпретационного сервиса.
Для поиска родственников важны совпадения по ДНК, а это предоставляют сами помпании.

Оффлайн sergey_mАвтор темы

  • Сообщений: 3
  • Страна: ru
  • Рейтинг +0/-0
Re: HG19 HG38 build 37
« Ответ #2 : 18 Июль 2022, 13:50:07 »
Самостоятельно, как правило, не работают с файлами. Для информации о здоровье достаточно информации компании или интерпретационного сервиса.
Для поиска родственников важны совпадения по ДНК, а это предоставляют сами помпании.

Да, всё верно. К сожалению, не все "образцы" доступны на общедоступных площадках, таких как GedMatch. Кроме того, одни и те же образцы на разных площадках могут "совпадать" с  моим в разной степени вплоть до радикального отличия: на одной площадке есть совпадения, а на другой вообще нет.

В результате, похоже, придётся самостоятельно качать исходные BAM или даже FASTA/FASTQ файлы, превращать их во что-то вроде VCF и потом как-то сравнивать с собой уже. К сожалению, это означает необходимость вникать в технические детали.

Оффлайн Val_Metov

  • Сообщений: 887
  • Страна: ru
  • Рейтинг +596/-2
  • Y-ДНК: J-Y94477
Re: HG19 HG38 build 37
« Ответ #3 : 18 Июль 2022, 17:03:05 »
Ничего сложного. Скачайте wgsextract, он все умеет. Можно из готового bam/cram файла вернуть исходный fastq и сделать новое выравнивание. bwa-mem2 +- в 2 раза быстрее bwa-mem. Есть ещё bwa-meme, ещё быстрее, но требует мощный ПК. Можно все сделать на удаленном сервере. Полистайте fb группу Dante labs/Nebula

Оффлайн Val_Metov

  • Сообщений: 887
  • Страна: ru
  • Рейтинг +596/-2
  • Y-ДНК: J-Y94477
Re: HG19 HG38 build 37
« Ответ #4 : 18 Июль 2022, 22:08:47 »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.