АвторТема: Компания Dante Labs  (Прочитано 168792 раз)

0 Пользователей и 2 Гостей просматривают эту тему.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #375 : 25 Май 2019, 16:49:07 »
Спасибо большое ещё раз!
Сгенерирую новый файл по Вашему совету.

У меня такой вопрос: где можно скачивать самый последний дистрибутив WGS Extract?

Оффлайн ochkas

  • Сообщений: 594
  • Страна: af
  • Рейтинг +297/-0
  • FTDNA: 634321
    • Ochkas DNA
  • Y-ДНК: R1a-L1029-Y128293 (UKR)
  • мтДНК: U3a3a1a1 (BLR)
Re: Компания Dante Labs
« Ответ #376 : 12 Июнь 2019, 22:23:50 »
Здравствуйте.
Не могу найти адрес куда отправлять тест DanteLabs.
Подскажите пожалуйста.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #377 : 12 Июнь 2019, 22:30:58 »
Здравствуйте.
Не могу найти адрес куда отправлять тест DanteLabs.
Подскажите пожалуйста.

Обратный адрес напечатан на коробочке, в которой Вы отошлёте свой образец.

Оффлайн ochkas

  • Сообщений: 594
  • Страна: af
  • Рейтинг +297/-0
  • FTDNA: 634321
    • Ochkas DNA
  • Y-ДНК: R1a-L1029-Y128293 (UKR)
  • мтДНК: U3a3a1a1 (BLR)
Re: Компания Dante Labs
« Ответ #378 : 12 Июнь 2019, 22:33:55 »
Спасибо.
Но к сожалению на коробочке нет адреса.
Пришли из Голландии.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #379 : 12 Июнь 2019, 22:51:18 »
Спасибо.
Но к сожалению на коробочке нет адреса.
Пришли из Голландии.

У меня пришли из Нью-Йорка с предоплатой в Италию.

Совсем, выходит, другой случай.

:(

Оффлайн TK

  • Сообщений: 505
  • Страна: ru
  • Рейтинг +385/-0
Re: Компания Dante Labs
« Ответ #380 : 12 Июнь 2019, 23:07:50 »
В личном кабинете есть возможность сформировать квиток для возврата - там должен быть адрес. Однако из России рекомендую возврат делать не используя квиток, а просто почтой мелким пакетом.
Дополнение: стоимость, указанная на CN22, не должна превышать примерно 22 евро, иначе возврат застрянет на итальянской таможне, и едва ли кто-то в Dante Labs будет платить пошлину для его получения.
« Последнее редактирование: 12 Июнь 2019, 23:14:40 от TK »

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #381 : 12 Июнь 2019, 23:45:56 »
Стоимость по всем тестам указываю 1$. Просто меньше не укажешь.

:)

Оффлайн TK

  • Сообщений: 505
  • Страна: ru
  • Рейтинг +385/-0
Re: Компания Dante Labs
« Ответ #382 : 13 Июнь 2019, 14:57:14 »
]В принципе можно _легко_ сделать файл типа 23andMe для корректной загрузки на гедматч из bam файла от Данте.
Совместно с уважаемым Daemon2017 мы составили небольшую инструкцию как вырезать из bam'а Y и MT на компьютере с Win 10. Можно дополнить и тем как создать VCF для загрузки на Гедматч.
Беда только в том, что инструкция состоит из картинок и наборов технических фраз. Возможно кто-то "причешет" ее?)))
Думаю это поможет всем клиентам Данте.

Присылайте мне. Вот только в ближайшее время скорее всего заняться ей не получится, так как на мне сейчас два достаточно объёмных дела, и ко второму ещё даже не приступал ;D Может быть, кто-то более оперативно сработает.

В прошлом году я делал файл аутосомы + X формата FTDNA на основе VCF от YSeq, но специфическими наколенными методами, инструкцию для использования на их основе не составить. После добавления отсутствующих снипов из референса результаты этнокалькуляторов полностью нормализовались, но вот поиск родственников, как по мне, стал даже хуже - часть сегментов разорвалась.
Набросок руководства тут.

Прекрасное руководство!
Могу только добавить, что скорее всего также можно выполнить удаление дубликатов и из Y-части BAM-файла (так как оцениваю с вероятностью более 95%, что это всё равно производится на стороне YFull автоматически). Это ещё сократит размер окончательного файла.

Оффлайн TK

  • Сообщений: 505
  • Страна: ru
  • Рейтинг +385/-0
Re: Компания Dante Labs
« Ответ #383 : 14 Июнь 2019, 16:17:21 »
Файл BAM готовы предоставить только на жестком диске (за 59 евро), иначе предлагают скомпилировать его самостоятельно (после получения ссылок на FASTQ-файлы) при помощи приложения EvE Premium на Sequencing.com (19,99 $).

Если кто соберется сам компилировать BAM из FastQ, то на основании имеющегося у меня образца Dante Labs из числа недавно полученных, для генеалогических целей могу порекомендовать следующее.
Внимание! Образцы из Dante Labs могут сильно отличаться - у меня нет общей статистики по ним, соответственно, все рекомендации могут быть использованы только на свой страх и риск.

Для сборки, похоже, лучше всего использовать референс GCA_000001405.15_GRCh38_no_alt_plus_hs38d1_analysis_set.fna.gz, который содержит GRCh38 без альтернативных регионов, но содержит последовательности-приманки для удаления мусорных кусков ДНК (ну типа от загрязнений вирусами и пр). Я попробовал почти 10 разных референсов Hg19 и Hg38 - и у данного получалось наиболее простое выравнивание, без лишних артефактов.

При этом, для выравнивания можно использовать либо бесплатный https://usegalaxy.eu/ (к тому же, мне он кажется более надежным, чем американский sequencing.com). Кратко схема действий для него:
1. Зарегистрироваться (да, кстати - лучше использовать браузер Google Chrome)
2. Загрузить свои FastQ файлы, используя какой-нибудь FTP клиент (там есть инструкция), и импортировать файлы после загрузки по FTP.
3. Загрузить референсную последовательность, указанную выше.
Внимание - после всей загрузки проверить, что среди hidden файлов нет загруженных в распакованном виде! Место на usegalaxy ограниченно 250 Гб, поэтому распакованные файлы могут его тут же "сожрать". Если есть такие hidden распакованные файлы - их можно и нужно безболезненно удалить.
4. Выполнить выравнивание (сформировать BAM) используя Map with BWA - map short reads (< 100 bp) against reference genome (Galaxy Version 0.7.17.4) и выбрав загруженную ранее референсную последовательность и оба FastQ файла (фактически, выполнится bwa sampe, с дальнейшей сортировкой и индексированием). Вполне можно всё делать с дефолтными настройками!
5. По получении результата загрузить к себе BAM файл, и обработать его перед передачей в YFull согласно инструкции, которая проскакивала ранее.

Либо выполнить выравнивание самостоятельно. Опять же, в той инструкции, что проскакивала ранее, есть описание установки Ubuntu-подсистемы под Windows (либо просто поставить себе Ubuntu или иную *nix-операционку на какой-либо сервер),
1. Установить утилиты samtools и bwa (для BAM этого будет достаточно). Можно ориентироваться на инструкции типа https://www.biostars.org/p/328831/ (за исключением Export To Path And Refresh - оно чуть иначе устроено, вроде как).
2. Выполнить выравнивание, используя (далее - код для примера. Референс, упомянутый выше, здесь именован как GRCh38nap1.fna.gz):
bwa index GRCh38nap1.fna.gz
bwa aln -t 256 GRCh38nap1.fna.gz R1.fastq.gz > R1-38.sai
bwa aln -t 256 GRCh38nap1.fna.gz R2.fastq.gz > R2-38.sai
bwa sampe -P GRCh38nap1.fna.gz R1-38.sai R2-38.sai R1.fastq.gz R2.fastq.gz > R38.sam
samtools view -@ 256 -bS R38.sam > R38v.bam
samtools sort -@ 256 -O bam -o R38.bam -T R38temp R38v.bam
samtools index -@ 256 R38.bam
(примечание - число 256 везде, где оно есть, означает количество потоков обработки (multi-threading) - это зависит от количества потоков процессоров/ядер вашего сервера/компа и его следует поменять в зависимости от Ваших условий - например, для домашней машины вполне может хватить и значения 4 или 8 ).
3. И опять же, обработать полученный файл по инструкции, которая проскакивала ранее.

Для предварительного просмотра полученного файла можно использовать браузер IGV и иные утилиты.
Выделение снипов и инделов - отдельный разговор. В данном случае (материал из Dante Labs) я бы просто рекомендовал далее отправить BAM в YFull.

Попробовал и иные инструменты для выравнивания (hisat2, bowtie2, NextGenMap и некоторые другие) - они давали бОльшее количество артефактов в генерируемом файле, равно как и bwa mem (что странно, поскольку вроде его использует сам Dante Labs). На данный момент bwa sampe показал лучшие результаты, а на втором месте bwa bwasw.

Вероятно, кто-то из маститых биоинформатиков меня поправит (особенно, если есть статистика по Dante Labs), но считаю, что хоть какую-то инструкцию хотелось бы людям дать - глядишь, ещё к чему-нибудь полезному это приведёт :)
« Последнее редактирование: 15 Ноябрь 2019, 15:55:57 от TK »

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Компания Dante Labs
« Ответ #384 : 15 Июнь 2019, 08:33:49 »
А вот это кто-нибудь уже проверял на себе?


Кстати, в приложениях попадаются весьма интересные штучки.
Например:

Цитировать
EvE v4 supports the following (please note that some functionality is only available in EvE Premium and EvE Premium Batch):
If a conversion is only possible in EvE Premium then this conversion will still appear in EvE Free but will not be able to be selected (it will appear as an 'inactive' selection).

FASTQ to gVCF and regular VCF (Supports both single end reads and paired-end reads)
FASTA to to gVCF and regular VCF (Supports both single end reads and paired-end reads)
FASTQ to BAM
FASTA to BAM
FASTQ to SAM
FASTA to SAM
SAM to FASTQ
BAM to FASTQ
BAM to gVCF (genome VCF) and regular VCF
SAM to gVCF (genome VCF) and regular VCF
SAM to BAM
BAM to SAM
BAM to SVG
BAM to CRAM
SAM to CRAM
CRAM to VCF
BED to VCF
VCF to WT (Wormtable)
GVF to VCF
gVCF (genome VCF) to VCF
Text region lists to VCF: When a region list is supplied then data for those regions will be extracted.
CSV to VCF (specific formatting required)
TXT to VCF (specific formatting required)
FASTA/ FASTQ/ SAM or BAM to Clinical plus VCF: This is Sequencing VCF format file that included calls and no calls data but excludes reference calls.
FASTA/ FASTQ/ SAM or BAM to annotated VCF file
FASTA/ FASTQ/ SAM/ BAM and VCF file to GVF: Supports converting  Genome Variation Format file
FASTA/ FASTQ/ SAM/ BAM and VCF to Wormtable format
Array to VCF: Converts a gene array file including 23andMe, Ancestry.com, Family Tree DNA and The Genographic Project (National Geographic) into a VCF file

https://sequencing.com/eve-free-dna-data-genome-data-conversion-analysis-app

Допустим есть интересные научные файлы в FASTQ, которые вы бы хотели забросить на YFull - вот конвертер. Но это пока в планах, сам не пробовал:)

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #385 : 17 Июнь 2019, 23:35:42 »
У Вас обычный, или ЛонгРид?

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #386 : 17 Июнь 2019, 23:52:43 »
У Вас обычный, или ЛонгРид?
Так как по логистике в/из Украины было вообще ничего непонятно, решил для пробы взять обычный. На скидках обошлось в 199€, что очень даже неплохо.

Отлично.
Собственно, по качеству и так пойдёт.

Потом сравним свои объединённые файлы: мой, Ваш, rnk, других форумчан.

:)

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #387 : 02 Июль 2019, 19:03:00 »
Отлично!
Спасибо за новость.
Надеюсь, что пока свой ЛонгРид получу, сделают подобный резак и для ИгрекФулл (игрек+ мито).   ::)

Оффлайн TK

  • Сообщений: 505
  • Страна: ru
  • Рейтинг +385/-0
Re: Компания Dante Labs
« Ответ #388 : 14 Июль 2019, 17:13:32 »
Просто для истории цен: сегодня у Dante Labs полный геном стоит 299 евро в честь открытия их тестового центра.

Оффлайн mdn

  • Сообщений: 263
  • Страна: fi
  • Рейтинг +142/-0
  • Y-ДНК: R-FGC56440
  • мтДНК: R1a1a1
Re: Компания Dante Labs
« Ответ #389 : 15 Июль 2019, 07:59:56 »
Просто для истории цен: сегодня у Dante Labs
Сегодня и вчера тоже 299. В честь amazon prime.

Думаю.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.