Тема: Компания Dante Labs (Прочитано 179989 раз)

Mich Glitch · « **Ответ #375 :** 25 Май 2019, 16:49:07 »

Спасибо большое ещё раз!
Сгенерирую новый файл по Вашему совету.

У меня такой вопрос: где можно скачивать самый последний дистрибутив WGS Extract?

ochkas · « **Ответ #376 :** 12 Июнь 2019, 22:23:50 »

Здравствуйте.
Не могу найти адрес куда отправлять тест DanteLabs.
Подскажите пожалуйста.

Mich Glitch · « **Ответ #377 :** 12 Июнь 2019, 22:30:58 »

Цитата: ochkas от 12 Июнь 2019, 22:23:50

Здравствуйте.
Не могу найти адрес куда отправлять тест DanteLabs.
Подскажите пожалуйста.

Обратный адрес напечатан на коробочке, в которой Вы отошлёте свой образец.

ochkas · « **Ответ #378 :** 12 Июнь 2019, 22:33:55 »

Спасибо.
Но к сожалению на коробочке нет адреса.
Пришли из Голландии.

Mich Glitch · « **Ответ #379 :** 12 Июнь 2019, 22:51:18 »

Цитата: ochkas от 12 Июнь 2019, 22:33:55

Спасибо.
Но к сожалению на коробочке нет адреса.
Пришли из Голландии.

У меня пришли из Нью-Йорка с предоплатой в Италию.

Совсем, выходит, другой случай.

TK · « **Ответ #380 :** 12 Июнь 2019, 23:07:50 »

В личном кабинете есть возможность сформировать квиток для возврата - там должен быть адрес. Однако из России рекомендую возврат делать не используя квиток, а просто почтой мелким пакетом.
Дополнение: стоимость, указанная на CN22, не должна превышать примерно 22 евро, иначе возврат застрянет на итальянской таможне, и едва ли кто-то в Dante Labs будет платить пошлину для его получения.

Mich Glitch · « **Ответ #381 :** 12 Июнь 2019, 23:45:56 »

Стоимость по всем тестам указываю 1$. Просто меньше не укажешь.

TK · « **Ответ #382 :** 13 Июнь 2019, 14:57:14 »

Цитата: Semargl от 09 Январь 2019, 10:22:32

Цитата: Srkz от 09 Январь 2019, 07:40:59
Цитата: Semargl от 09 Январь 2019, 06:41:18
]В принципе можно _легко_ сделать файл типа 23andMe для корректной загрузки на гедматч из bam файла от Данте.
Совместно с уважаемым Daemon2017 мы составили небольшую инструкцию как вырезать из bam'а Y и MT на компьютере с Win 10. Можно дополнить и тем как создать VCF для загрузки на Гедматч.
Беда только в том, что инструкция состоит из картинок и наборов технических фраз. Возможно кто-то "причешет" ее?)))
Думаю это поможет всем клиентам Данте.

Присылайте мне. Вот только в ближайшее время скорее всего заняться ей не получится, так как на мне сейчас два достаточно объёмных дела, и ко второму ещё даже не приступал Может быть, кто-то более оперативно сработает.

В прошлом году я делал файл аутосомы + X формата FTDNA на основе VCF от YSeq, но специфическими наколенными методами, инструкцию для использования на их основе не составить. После добавления отсутствующих снипов из референса результаты этнокалькуляторов полностью нормализовались, но вот поиск родственников, как по мне, стал даже хуже - часть сегментов разорвалась.
Набросок руководства тут.

Прекрасное руководство!
Могу только добавить, что скорее всего также можно выполнить удаление дубликатов и из Y-части BAM-файла (так как оцениваю с вероятностью более 95%, что это всё равно производится на стороне YFull автоматически). Это ещё сократит размер окончательного файла.

TK · « **Ответ #383 :** 14 Июнь 2019, 16:17:21 »

Цитата: rmk от 13 Июнь 2019, 21:41:41

Файл BAM готовы предоставить только на жестком диске (за 59 евро), иначе предлагают скомпилировать его самостоятельно (после получения ссылок на FASTQ-файлы) при помощи приложения EvE Premium на Sequencing.com (19,99 $).

Если кто соберется сам компилировать BAM из FastQ, то на основании имеющегося у меня образца Dante Labs из числа недавно полученных, для генеалогических целей могу порекомендовать следующее.
Внимание! Образцы из Dante Labs могут сильно отличаться - у меня нет общей статистики по ним, соответственно, все рекомендации могут быть использованы только на свой страх и риск.

Для сборки, похоже, лучше всего использовать референс GCA_000001405.15_GRCh38_no_alt_plus_hs38d1_analysis_set.fna.gz, который содержит GRCh38 без альтернативных регионов, но содержит последовательности-приманки для удаления мусорных кусков ДНК (ну типа от загрязнений вирусами и пр). Я попробовал почти 10 разных референсов Hg19 и Hg38 - и у данного получалось наиболее простое выравнивание, без лишних артефактов.

При этом, для выравнивания можно использовать либо бесплатный https://usegalaxy.eu/ (к тому же, мне он кажется более надежным, чем американский sequencing.com). Кратко схема действий для него:
1. Зарегистрироваться (да, кстати - лучше использовать браузер Google Chrome)
2. Загрузить свои FastQ файлы, используя какой-нибудь FTP клиент (там есть инструкция), и импортировать файлы после загрузки по FTP.
3. Загрузить референсную последовательность, указанную выше.
Внимание - после всей загрузки проверить, что среди hidden файлов нет загруженных в распакованном виде! Место на usegalaxy ограниченно 250 Гб, поэтому распакованные файлы могут его тут же "сожрать". Если есть такие hidden распакованные файлы - их можно и нужно безболезненно удалить.
4. Выполнить выравнивание (сформировать BAM) используя Map with BWA - map short reads (< 100 bp) against reference genome (Galaxy Version 0.7.17.4) и выбрав загруженную ранее референсную последовательность и оба FastQ файла (фактически, выполнится bwa sampe, с дальнейшей сортировкой и индексированием). Вполне можно всё делать с дефолтными настройками!
5. По получении результата загрузить к себе BAM файл, и обработать его перед передачей в YFull согласно инструкции, которая проскакивала ранее.

Либо выполнить выравнивание самостоятельно. Опять же, в той инструкции, что проскакивала ранее, есть описание установки Ubuntu-подсистемы под Windows (либо просто поставить себе Ubuntu или иную *nix-операционку на какой-либо сервер),
1. Установить утилиты samtools и bwa (для BAM этого будет достаточно). Можно ориентироваться на инструкции типа https://www.biostars.org/p/328831/ (за исключением Export To Path And Refresh - оно чуть иначе устроено, вроде как).
2. Выполнить выравнивание, используя (далее - код для примера. Референс, упомянутый выше, здесь именован как GRCh38nap1.fna.gz):
bwa index GRCh38nap1.fna.gz
bwa aln -t 256 GRCh38nap1.fna.gz R1.fastq.gz > R1-38.sai
bwa aln -t 256 GRCh38nap1.fna.gz R2.fastq.gz > R2-38.sai
bwa sampe -P GRCh38nap1.fna.gz R1-38.sai R2-38.sai R1.fastq.gz R2.fastq.gz > R38.sam
samtools view -@ 256 -bS R38.sam > R38v.bam
samtools sort -@ 256 -O bam -o R38.bam -T R38temp R38v.bam
samtools index -@ 256 R38.bam
(примечание - число 256 везде, где оно есть, означает количество потоков обработки (multi-threading) - это зависит от количества потоков процессоров/ядер вашего сервера/компа и его следует поменять в зависимости от Ваших условий - например, для домашней машины вполне может хватить и значения 4 или 8 ).
3. И опять же, обработать полученный файл по инструкции, которая проскакивала ранее.

Для предварительного просмотра полученного файла можно использовать браузер IGV и иные утилиты.
Выделение снипов и инделов - отдельный разговор. В данном случае (материал из Dante Labs) я бы просто рекомендовал далее отправить BAM в YFull.

Попробовал и иные инструменты для выравнивания (hisat2, bowtie2, NextGenMap и некоторые другие) - они давали бОльшее количество артефактов в генерируемом файле, равно как и bwa mem (что странно, поскольку вроде его использует сам Dante Labs). На данный момент bwa sampe показал лучшие результаты, а на втором месте bwa bwasw.

Вероятно, кто-то из маститых биоинформатиков меня поправит (особенно, если есть статистика по Dante Labs), но считаю, что хоть какую-то инструкцию хотелось бы людям дать - глядишь, ещё к чему-нибудь полезному это приведёт

Шад · « **Ответ #384 :** 15 Июнь 2019, 08:33:49 »

А вот это кто-нибудь уже проверял на себе?

Цитата: Шад от 09 Май 2019, 12:54:31

Кстати, в приложениях попадаются весьма интересные штучки.
Например:

Цитировать
EvE v4 supports the following (please note that some functionality is only available in EvE Premium and EvE Premium Batch):
If a conversion is only possible in EvE Premium then this conversion will still appear in EvE Free but will not be able to be selected (it will appear as an 'inactive' selection).

FASTQ to gVCF and regular VCF (Supports both single end reads and paired-end reads)
FASTA to to gVCF and regular VCF (Supports both single end reads and paired-end reads)
FASTQ to BAM
FASTA to BAM
FASTQ to SAM
FASTA to SAM
SAM to FASTQ
BAM to FASTQ
BAM to gVCF (genome VCF) and regular VCF
SAM to gVCF (genome VCF) and regular VCF
SAM to BAM
BAM to SAM
BAM to SVG
BAM to CRAM
SAM to CRAM
CRAM to VCF
BED to VCF
VCF to WT (Wormtable)
GVF to VCF
gVCF (genome VCF) to VCF
Text region lists to VCF: When a region list is supplied then data for those regions will be extracted.
CSV to VCF (specific formatting required)
TXT to VCF (specific formatting required)
FASTA/ FASTQ/ SAM or BAM to Clinical plus VCF: This is Sequencing VCF format file that included calls and no calls data but excludes reference calls.
FASTA/ FASTQ/ SAM or BAM to annotated VCF file
FASTA/ FASTQ/ SAM/ BAM and VCF file to GVF: Supports converting Genome Variation Format file
FASTA/ FASTQ/ SAM/ BAM and VCF to Wormtable format
Array to VCF: Converts a gene array file including 23andMe, Ancestry.com, Family Tree DNA and The Genographic Project (National Geographic) into a VCF file

https://sequencing.com/eve-free-dna-data-genome-data-conversion-analysis-app

Допустим есть интересные научные файлы в FASTQ, которые вы бы хотели забросить на YFull - вот конвертер. Но это пока в планах, сам не пробовал:)

Mich Glitch · « **Ответ #385 :** 17 Июнь 2019, 23:35:42 »

У Вас обычный, или ЛонгРид?

Mich Glitch · « **Ответ #386 :** 17 Июнь 2019, 23:52:43 »

Цитата: sergm от 17 Июнь 2019, 23:43:51

Цитата: Mich Glitch от 17 Июнь 2019, 23:35:42
У Вас обычный, или ЛонгРид?
Так как по логистике в/из Украины было вообще ничего непонятно, решил для пробы взять обычный. На скидках обошлось в 199€, что очень даже неплохо.

Отлично.
Собственно, по качеству и так пойдёт.

Потом сравним свои объединённые файлы: мой, Ваш, rnk, других форумчан.

Mich Glitch · « **Ответ #387 :** 02 Июль 2019, 19:03:00 »

Отлично!
Спасибо за новость.
Надеюсь, что пока свой ЛонгРид получу, сделают подобный резак и для ИгрекФулл (игрек+ мито).

TK · « **Ответ #388 :** 14 Июль 2019, 17:13:32 »

Просто для истории цен: сегодня у Dante Labs полный геном стоит 299 евро в честь открытия их тестового центра.

mdn · « **Ответ #389 :** 15 Июль 2019, 07:59:56 »

Цитата: TK от 14 Июль 2019, 17:13:32

Просто для истории цен: сегодня у Dante Labs

Сегодня и вчера тоже 299. В честь amazon prime.

Думаю.

АвторТема: Компания Dante Labs (Прочитано 179989 раз)

Mich Glitch

Re: Компания Dante Labs

ochkas

Re: Компания Dante Labs

Mich Glitch

Re: Компания Dante Labs

ochkas

Re: Компания Dante Labs

Mich Glitch

Re: Компания Dante Labs

TK

Re: Компания Dante Labs

Mich Glitch

Re: Компания Dante Labs

TK

Re: Компания Dante Labs

TK

Re: Компания Dante Labs

Шад

Re: Компания Dante Labs

Mich Glitch

Re: Компания Dante Labs

Mich Glitch

Re: Компания Dante Labs

Mich Glitch

Re: Компания Dante Labs

TK

Re: Компания Dante Labs

mdn

Re: Компания Dante Labs