АвторТема: Компания Dante Labs  (Прочитано 23568 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн rmk

  • Сообщений: 120
  • Страна: ru
  • Рейтинг +66/-30
Re: Компания Dante Labs
« Ответ #405 : 12 Июнь 2019, 23:01:26 »
Не могу найти адрес куда отправлять тест DanteLabs.
Я отправлял на этот:

Francesco Pennelli (Dante Labs)
Corso Federico II, 73 (terzo piano)
L'Aquila, 67100
Italy (Италия)
+39 349 009-46-69

Оффлайн TK

  • Сообщений: 271
  • Страна: ru
  • Рейтинг +157/-0
Re: Компания Dante Labs
« Ответ #406 : 12 Июнь 2019, 23:07:50 »
В личном кабинете есть возможность сформировать квиток для возврата - там должен быть адрес. Однако из России рекомендую возврат делать не используя квиток, а просто почтой мелким пакетом.
Дополнение: стоимость, указанная на CN22, не должна превышать примерно 22 евро, иначе возврат застрянет на итальянской таможне, и едва ли кто-то в Dante Labs будет платить пошлину для его получения.
« Последнее редактирование: 12 Июнь 2019, 23:14:40 от TK »

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34044
  • Страна: ca
  • Рейтинг +2821/-44
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #407 : 12 Июнь 2019, 23:45:56 »
Стоимость по всем тестам указываю 1$. Просто меньше не укажешь.

:)

Оффлайн TK

  • Сообщений: 271
  • Страна: ru
  • Рейтинг +157/-0
Re: Компания Dante Labs
« Ответ #408 : 13 Июнь 2019, 14:57:14 »
]В принципе можно _легко_ сделать файл типа 23andMe для корректной загрузки на гедматч из bam файла от Данте.
Совместно с уважаемым Daemon2017 мы составили небольшую инструкцию как вырезать из bam'а Y и MT на компьютере с Win 10. Можно дополнить и тем как создать VCF для загрузки на Гедматч.
Беда только в том, что инструкция состоит из картинок и наборов технических фраз. Возможно кто-то "причешет" ее?)))
Думаю это поможет всем клиентам Данте.

Присылайте мне. Вот только в ближайшее время скорее всего заняться ей не получится, так как на мне сейчас два достаточно объёмных дела, и ко второму ещё даже не приступал ;D Может быть, кто-то более оперативно сработает.

В прошлом году я делал файл аутосомы + X формата FTDNA на основе VCF от YSeq, но специфическими наколенными методами, инструкцию для использования на их основе не составить. После добавления отсутствующих снипов из референса результаты этнокалькуляторов полностью нормализовались, но вот поиск родственников, как по мне, стал даже хуже - часть сегментов разорвалась.
Набросок руководства тут.

Прекрасное руководство!
Могу только добавить, что скорее всего также можно выполнить удаление дубликатов и из Y-части BAM-файла (так как оцениваю с вероятностью более 95%, что это всё равно производится на стороне YFull автоматически). Это ещё сократит размер окончательного файла.

Оффлайн rmk

  • Сообщений: 120
  • Страна: ru
  • Рейтинг +66/-30
Re: Компания Dante Labs
« Ответ #409 : 13 Июнь 2019, 21:41:41 »
Прошло три с половиной недели со дня готовности результатов, а ссылок на FASTQ-файлы все еще нет.

В поддержке на очередной запрос ответили вчера следующее:
Цитировать
I understand this delay is longer than expected. However, our dedicated internal team is still working to have this resolved. You have our word, that we will continue to work on this until its rectified.
 
Thanks for your continued patience. We apologize for any inconvenience this may have caused.


Я понимаю, что эта задержка дольше, чем ожидалось. Однако наша выделенная внутренняя команда все еще работает над решением этой проблемы. Даем свое слово, что мы будем продолжать над этим работать до ее устранения.
 
Спасибо за Ваше длительное терпение. Приносим извинения за любые возможные неудобства.

Файл BAM готовы предоставить только на жестком диске (за 59 евро), иначе предлагают скомпилировать его самостоятельно (после получения ссылок на FASTQ-файлы) при помощи приложения EvE Premium на Sequencing.com (19,99 $).

Оффлайн TK

  • Сообщений: 271
  • Страна: ru
  • Рейтинг +157/-0
Re: Компания Dante Labs
« Ответ #410 : 14 Июнь 2019, 16:17:21 »
Файл BAM готовы предоставить только на жестком диске (за 59 евро), иначе предлагают скомпилировать его самостоятельно (после получения ссылок на FASTQ-файлы) при помощи приложения EvE Premium на Sequencing.com (19,99 $).

Если кто соберется сам компилировать BAM из FastQ, то на основании имеющегося у меня образца Dante Labs из числа недавно полученных, для генеалогических целей могу порекомендовать следующее.
Внимание! Образцы из Dante Labs могут сильно отличаться - у меня нет общей статистики по ним, соответственно, все рекомендации могут быть использованы только на свой страх и риск.

Для сборки, похоже, лучше всего использовать референс GCA_000001405.15_GRCh38_no_alt_plus_hs38d1_analysis_set.fna.gz, который содержит GRCh38 без альтернативных регионов, но содержит последовательности-приманки для удаления мусорных кусков ДНК (ну типа от загрязнений вирусами и пр). Я попробовал почти 10 разных референсов Hg19 и Hg38 - и у данного получалось наиболее простое выравнивание, без лишних артефактов.

При этом, для выравнивания можно использовать либо бесплатный https://usegalaxy.eu/ (к тому же, мне он кажется более надежным, чем американский sequencing.com). Кратко схема действий для него:
1. Зарегистрироваться (да, кстати - лучше использовать браузер Google Chrome)
2. Загрузить свои FastQ файлы, используя какой-нибудь FTP клиент (там есть инструкция), и импортировать файлы после загрузки по FTP.
3. Загрузить референсную последовательность, указанную выше.
Внимание - после всей загрузки проверить, что среди hidden файлов нет загруженных в распакованном виде! Место на usegalaxy ограниченно 250 Гб, поэтому распакованные файлы могут его тут же "сожрать". Если есть такие hidden распакованные файлы - их можно и нужно безболезненно удалить.
4. Выполнить выравнивание (сформировать BAM) используя Map with BWA - map short reads (< 100 bp) against reference genome (Galaxy Version 0.7.17.4) и выбрав загруженную ранее референсную последовательность и оба FastQ файла (фактически, выполнится bwa sampe, с дальнейшей сортировкой и индексированием). Вполне можно всё делать с дефолтными настройками!
5. По получении результата загрузить к себе BAM файл, и обработать его перед передачей в YFull согласно инструкции, которая проскакивала ранее.

Либо выполнить выравнивание самостоятельно. Опять же, в той инструкции, что проскакивала ранее, есть описание установки Ubuntu-подсистемы под Windows (либо просто поставить себе Ubuntu или иную *nix-операционку на какой-либо сервер),
1. Установить утилиты samtools и bwa (для BAM этого будет достаточно). Можно ориентироваться на инструкции типа https://www.biostars.org/p/328831/ (за исключением Export To Path And Refresh - оно чуть иначе устроено, вроде как).
2. Выполнить выравнивание, используя (далее - код для примера. Референс, упомянутый выше, здесь именован как GRCh38nap1.fna.gz):
bwa index GRCh38nap1.fna.gz
bwa aln -t 256 GRCh38nap1.fna.gz R1.fastq.gz > R1-38.sai
bwa aln -t 256 GRCh38nap1.fna.gz R2.fastq.gz > R2-38.sai
bwa sampe -P GRCh38nap1.fna.gz R1-38.sai R2-38.sai R1.fastq.gz R2.fastq.gz > R38.sam
samtools view -@ 256 -bS R38.sam > R38v.bam
samtools sort -@ 256 -O bam -o R38.bam -T R38temp R38v.bam
samtools index -@ 256 R38.bam
(примечание - число 256 везде, где оно есть, означает количество потоков обработки (multi-threading) - это зависит от количества потоков процессоров/ядер вашего сервера/компа и его следует поменять в зависимости от Ваших условий - например, для домашней машины вполне может хватить и значения 4 или 8 ).
3. И опять же, обработать полученный файл по инструкции, которая проскакивала ранее.

Для предварительного просмотра полученного файла можно использовать браузер IGV и иные утилиты.
Выделение снипов и инделов - отдельный разговор. В данном случае (материал из Dante Labs) я бы просто рекомендовал далее отправить BAM в YFull.

Попробовал и иные инструменты для выравнивания (hisat2, bowtie2, NextGenMap и некоторые другие) - они давали бОльшее количество артефактов в генерируемом файле, равно как и bwa mem (что странно, поскольку вроде его использует сам Dante Labs). На данный момент bwa sampe показал лучшие результаты, а на втором месте bwa bwasw.

Вероятно, кто-то из маститых биоинформатиков меня поправит (особенно, если есть статистика по Dante Labs), но считаю, что хоть какую-то инструкцию хотелось бы людям дать - глядишь, ещё к чему-нибудь полезному это приведёт :)
« Последнее редактирование: 14 Июнь 2019, 16:46:09 от TK »

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6232
  • Страна: ru
  • Рейтинг +1096/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Компания Dante Labs
« Ответ #411 : 15 Июнь 2019, 08:33:49 »
А вот это кто-нибудь уже проверял на себе?


Кстати, в приложениях попадаются весьма интересные штучки.
Например:

Цитировать
EvE v4 supports the following (please note that some functionality is only available in EvE Premium and EvE Premium Batch):
If a conversion is only possible in EvE Premium then this conversion will still appear in EvE Free but will not be able to be selected (it will appear as an 'inactive' selection).

FASTQ to gVCF and regular VCF (Supports both single end reads and paired-end reads)
FASTA to to gVCF and regular VCF (Supports both single end reads and paired-end reads)
FASTQ to BAM
FASTA to BAM
FASTQ to SAM
FASTA to SAM
SAM to FASTQ
BAM to FASTQ
BAM to gVCF (genome VCF) and regular VCF
SAM to gVCF (genome VCF) and regular VCF
SAM to BAM
BAM to SAM
BAM to SVG
BAM to CRAM
SAM to CRAM
CRAM to VCF
BED to VCF
VCF to WT (Wormtable)
GVF to VCF
gVCF (genome VCF) to VCF
Text region lists to VCF: When a region list is supplied then data for those regions will be extracted.
CSV to VCF (specific formatting required)
TXT to VCF (specific formatting required)
FASTA/ FASTQ/ SAM or BAM to Clinical plus VCF: This is Sequencing VCF format file that included calls and no calls data but excludes reference calls.
FASTA/ FASTQ/ SAM or BAM to annotated VCF file
FASTA/ FASTQ/ SAM/ BAM and VCF file to GVF: Supports converting  Genome Variation Format file
FASTA/ FASTQ/ SAM/ BAM and VCF to Wormtable format
Array to VCF: Converts a gene array file including 23andMe, Ancestry.com, Family Tree DNA and The Genographic Project (National Geographic) into a VCF file

https://sequencing.com/eve-free-dna-data-genome-data-conversion-analysis-app

Допустим есть интересные научные файлы в FASTQ, которые вы бы хотели забросить на YFull - вот конвертер. Но это пока в планах, сам не пробовал:)

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34044
  • Страна: ca
  • Рейтинг +2821/-44
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #412 : 17 Июнь 2019, 23:35:42 »
У Вас обычный, или ЛонгРид?

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34044
  • Страна: ca
  • Рейтинг +2821/-44
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #413 : 17 Июнь 2019, 23:52:43 »
У Вас обычный, или ЛонгРид?
Так как по логистике в/из Украины было вообще ничего непонятно, решил для пробы взять обычный. На скидках обошлось в 199€, что очень даже неплохо.

Отлично.
Собственно, по качеству и так пойдёт.

Потом сравним свои объединённые файлы: мой, Ваш, rnk, других форумчан.

:)

Оффлайн bulatv2

  • Сообщений: 187
  • Страна: ru
  • Рейтинг +49/-0
  • ftdna: 468412
  • Y-ДНК: R1a-Z92(YP682+)
  • мтДНК: H1b2
Re: Компания Dante Labs
« Ответ #414 : 29 Июнь 2019, 20:30:45 »
У меня появились 4 ссылки на vcf

Оффлайн rmk

  • Сообщений: 120
  • Страна: ru
  • Рейтинг +66/-30
Программа WGS Extract
« Ответ #415 : 02 Июль 2019, 18:46:00 »
20 июня на фейсбуке была опубликована новая бета-версия программы WGS Extract. Теперь можно генерировать комбинированный файл исходных данных "из коробки".

Описание от разработчика Марко Бауэра:
Цитировать
There is now a new beta version of the program "WGSExtract".
Now autosomal data can be exported not only as a 23andmeV3 file, but in all formats of the most important providers of the last 12 years (see screenshot).

IMPORTANT: You should always choose the option
"Combined file with all SNPs from the formats of all DNA test providers (RECOMMENDED)".
The resulting file contains SNPs of 2.3 million different positions of the autosomes and thus provides more accurate data then the other options in the screenshot.

Even if e.g. all other relatives were tested with FTDNAv2, it is better not to export the WGS results in FTDNAv2 format, but rather to use the export option of the combined file. The reason is that over the years even the "same" version of a provider often had minor changes in the SNP selection, or it turned out that single SNPs were not reliabe etc. This can be avoided if the comparison data set has the widest possible range of tested SNPs.
If the combined file is not accepted by an upload portal, then good alternatives are "All 23andMe SNPs since 2007" (almost 1.5 million SNPs) or 23andmeV3 (960,000 SNPs, though weak overlap with GSA tests). The other formats with coverages of 600,000 - 700,000 SNPs should only be selected as compatible fallback solutions if an upload portal does not accept one of the other files.

There were also a few other, minor improvements, e.g. acceptance of GRCh BAMs, index files are created if they are missing etc.
If you read the source code, then you can see that it has been worked on on other things as well, like MacOS compatibility, or autosomal export for HG38. But they are not ready yet and not active. Nevertheless, I decided to upload this "intermediate" version, so that I do no have to postpone the next version on and on.

Complete download link for the new version:
http://37.187.22.93/wgsextract/WGSExtractBeta.zip
If you have already installed the last version, just download the following, much smaller file and unzip it to the same directory as the old version:
http://37.187.22.93/wgsextract/WGSExtractBeta2Update.zip

This is still a beta version. Although the program is essentially a GUI that uses a combination of other open source software to fulfill the tasks, errors may still occur. Please report if you find any.



Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34044
  • Страна: ca
  • Рейтинг +2821/-44
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #416 : 02 Июль 2019, 19:03:00 »
Отлично!
Спасибо за новость.
Надеюсь, что пока свой ЛонгРид получу, сделают подобный резак и для ИгрекФулл (игрек+ мито).   ::)

Оффлайн TK

  • Сообщений: 271
  • Страна: ru
  • Рейтинг +157/-0
Re: Компания Dante Labs
« Ответ #417 : 14 Июль 2019, 17:13:32 »
Просто для истории цен: сегодня у Dante Labs полный геном стоит 299 евро в честь открытия их тестового центра.

Оффлайн mdn

  • Сообщений: 36
  • Страна: fi
  • Рейтинг +2/-0
  • Y-ДНК: R-M198
Re: Компания Dante Labs
« Ответ #418 : 15 Июль 2019, 07:59:56 »
Просто для истории цен: сегодня у Dante Labs
Сегодня и вчера тоже 299. В честь amazon prime.

Думаю.

Оффлайн Mooon

  • Сообщений: 2
  • Рейтинг +0/-0
Re: Компания Dante Labs
« Ответ #419 : 25 Июль 2019, 14:03:29 »
Здравствуйте! Кто-нибудь из России получал образец как физ.лицо в последнее время?
История вот какая...
В феврале мы участвовали в акции, купили по скидкой кит. С тех пор постоянно ожидания и бесполезная переписка, при чем пытать вопросами приходится постоянно, иначе тишина и молчание.
Обещали еще в мае выслать повторную пробирку, тк в первый раз якобы не прошла контроль. Затем месяц назад сообщили, что все-таки попытаются выделить днк. Но увы... еще 30 дней дурацкого ожидания. В кабинете при этом статус сменился "ваш новый кит в пути".

На запрос номера для отслеживания тут же получаем:

"Thanks for your purchase on our Website. International shipments to Russia, when directed to an individual, are extremely hard. Russian custom does not make any foreign parcel get into the country unless the final recipient is an enterprise.

It would be great if you could provide us with a VAT ID with the related business name."

К слову, VAT ID был отправлен еще 29.05. Вот мне интересно, реально физ.лица теперь не могут получить пробирки? Если на ип отправлять, растаможка? Стоит оно того??

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100