АвторТема: Компания Dante Labs  (Прочитано 31664 раз)

kardes и 1 Гость просматривают эту тему.

Оффлайн MCB

  • Сообщений: 44
  • Страна: 00
  • Рейтинг +27/-1
Re: Программа WGS Extract
« Ответ #465 : 09 Октябрь 2019, 05:24:25 »
также можно сравнить с "третейским арбитром" (посмотреть, что видно по спорным позициям у 23andMe).
В общем, заодно решил сравнить и с 23andMe. Первый сюрприз - то, что WGS extract пропустил 4861 из 5079 позиций в мтДНК. Как я припоминаю, дело в том, что референтная последовательность у Данте не совсем стандартная, где-то начинает отличаться на нуклеотид? А исправленного reference-файла для экстрактора ни у кого нет?

Различий между моим старым файлом от 23andMe (версии 3) и Данте оказалось на удивление много, 34 тысячи (5%). Файл от 23andMe содержал много гомозиготных генотипов, которые в соответствии с данными Данте были гетерозиготными, и гетерозиготных генотипов, которые в соответсвии с данными Данте были гомозиготными. Расхождения в генотипах wildtype/wildtype согласно 23andMe были очень редкими.

2118 маркеров расходились по генотипу от данных Данте и у фтДНК, и 23andMe (версии 3). Во всех без исключения из этих случаев чипы были на 100% в согласии друг с другом! Как явствует из предыдущего ссобщение, эта цифра близка к общему количеству расхождений между Данте и фтДНК. Так что в большинстве случаев оказалось, что фтДНК и Данте не соглашались по тому или иному маркеру, то чип 23andMe (версии 3) брал сторону фтДНК.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34820
  • Страна: ca
  • Рейтинг +3007/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #466 : 09 Октябрь 2019, 05:45:09 »
С точностью до наоборот.

:)

У 23эндМи - не полный митосиквенс.
И даже не HVR1 + HVR2, а своя кучка выбранных позиций.

Не совсем понятен смысл Ваших действий. Но то, что разбираетесь самостоятельно - заслуживает уважения. Даже несмотря на ошибочность и легковесность выводов.

::)

Оффлайн MCB

  • Сообщений: 44
  • Страна: 00
  • Рейтинг +27/-1
Re: Компания Dante Labs
« Ответ #467 : 09 Октябрь 2019, 07:22:29 »
Спасибо на добром слове :) Смысл был что я надеялся, что умудренные эксперты подскажут, как определить, кому надо доверять, когда разные компании со своими разными методами не согласны насчет генотипов. И как вообще варьирует качество анализов в пределах одной и той же технологии. Как я уже пару раз тут объяснил, меня волнуют редкие варианты в аутосомах на предмет датировки времени происхождения совпадающих сегментов, а для сравнения редких вариантов качество критично.

И еще, как подправить референс, чтобы экстрактор опознал снипы на мтДНК. Не то что я сам не разберусь, но неохота изобретать слишком много велосипедов (что 23andMe это чип, а не секвенирование, и только по примерно 5000 позиций в мтДНК, я уже отметил, но все равно спасибо за повторное разъяснение)

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5271
  • Страна: hr
  • Рейтинг +2571/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Компания Dante Labs
« Ответ #468 : 09 Октябрь 2019, 07:51:02 »
Спасибо на добром слове :) Смысл был что я надеялся, что умудренные эксперты подскажут, как определить, кому надо доверять, когда разные компании со своими разными методами не согласны насчет генотипов. И как вообще варьирует качество анализов в пределах одной и той же технологии. Как я уже пару раз тут объяснил, меня волнуют редкие варианты в аутосомах на предмет датировки времени происхождения совпадающих сегментов, а для сравнения редких вариантов качество критично.

И еще, как подправить референс, чтобы экстрактор опознал снипы на мтДНК. Не то что я сам не разберусь, но неохота изобретать слишком много велосипедов (что 23andMe это чип, а не секвенирование, и только по примерно 5000 позиций в мтДНК, я уже отметил, но все равно спасибо за повторное разъяснение)
Вы работаете с самтулз. Посмотрите на bash скриптик extract23 от Томаса Крана. Можете заодно по нему сверить свой алгоритм с общепринятым.
Библиотека со снипами в рефе hg19. Заменить на hg38 не проблема, я когда-то писал ее для Томаса, могу поискать.

FTDNA и 23&me не застрахованы от ошибок - определенный процент точно есть. Но у Dante короткая длина чтения, что обычно критично для выравнивания. И это тоже вызывает ошибки. Для выявления кто прав, я бы смотрел спорные позиции непосредственно в бам файле.

Реф мито без перемаппирования не подправить. Разные позиции. Только писать конвертер на основании правил, на которые выше я давал ссылку.

PS На досуге тоже хочу сравнить свои результаты от FTDNA и 23&me. Помнится что гедматч ругался на файл от FTDNA.

Оффлайн MCB

  • Сообщений: 44
  • Страна: 00
  • Рейтинг +27/-1
Re: Компания Dante Labs
« Ответ #469 : 09 Октябрь 2019, 19:09:20 »
самтулз. Посмотрите на bash скриптик extract23 от Томаса Крана.

... у Dante короткая длина чтения, что обычно критично для выравнивания. И это тоже вызывает ошибки. Для выявления кто прав, я бы смотрел спорные позиции непосредственно в бам файле.
Нет, на самом деле когда я занимался конверсией для закрузки в майхеритидж, то у нас еще не было ни одного бам-файла. Я просто подставлял для тех маркеров,которые отсутствовали в VCF, значения wildtype/wildtype. Ну и еще добавил три СНИПа в конце файла фтДНК, которые картируются и на Х, и на Y и могут служить для определения пола, фейковые значения длы "нужного" пола.

Скрипт создает отличный VCF файл с помощью bcftools с флагом -m. Но, конечно, да, alignment, выше себя не прыгнешь. Мы нередко имеем дело с проблемами, когда маркер работает на чипе, но из-за неодонозначностей выравнивания не работает в секвенировании. Как правило, или вообще рид картируется не оттуда, и маркер "оказывается" мономорфным или почти мономорфным, или происходит наложение двух схожих участков в геноме, и маркер "получается" гетерозиготным во всех образцах. Самый удобный контроль над качеством для таких проблем - это сравнить частоты аллелей с табличными и проверить на Харди-Вайнберга. Но для этого надо иметь довольно большой набор образцов. С одним-то образцом тут не разбежишься...

А насчет мтДНК, меня подмывает просто подождать и посмотреть, как у вас на Yfull это переварится ))) Есть и фаста-файлы, загружу, когда наконец счет придет ))

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5271
  • Страна: hr
  • Рейтинг +2571/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Компания Dante Labs
« Ответ #470 : 09 Октябрь 2019, 22:36:01 »
А насчет мтДНК, меня подмывает просто подождать и посмотреть, как у вас на Yfull это переварится ))) Есть и фаста-файлы, загружу, когда наконец счет придет ))
YFull с определенного времени перемаппирует мито по своим алгоритмам и по своему рефу.

Цитировать
Скрипт создает отличный VCF файл с помощью bcftools с флагом -m.
Вы правильно подметили этот флаг. Но на самом деле у чипа существует множество проблем. Самые известные - участки с высокой гомологией и участки со сложными инделами. В этих случаях даже Dante дает более точный результат.
У NGS основная проблема - "грязные" регионы, STR подобные регионы и области рядом с инделами.

Если честно, то необходимо принимать во внимание множество параметров, пытаясь найти решение возможных конфликтов. Из важных параметров: длина чтения, инструменты и реф выравнивания, гомология, палиндромность и тп и тд....

Оффлайн mdn

  • Сообщений: 116
  • Страна: fi
  • Рейтинг +43/-0
  • Y-ДНК: R-FGC56440
  • мтДНК: R1a1a1
Re: Компания Dante Labs
« Ответ #471 : 12 Октябрь 2019, 16:18:48 »
У Dante Labs акция - все новые заказы со сроком исполнения "2 недели". Возможности выбрать "8 недель" просто нет. Что это значит и какой будет в действительности срок - не знаю. :)
Заказал intro 4x за 99 евро (для мито и аутосом ребенка - у них вроде нет запрета на детей), посмотрю реальные сроки.

"Get 2 weeks turnaround time for the price of 8 weeks [Limited time offer]"

Оффлайн NathanS

  • Сообщений: 161
  • Рейтинг +117/-1
  • Y-ДНК: ЖМ: N1c-Z1939
Re: Компания Dante Labs
« Ответ #472 : 12 Октябрь 2019, 18:18:50 »
У Dante Labs акция - все новые заказы со сроком исполнения "2 недели". Возможности выбрать "8 недель" просто нет. Что это значит и какой будет в действительности срок - не знаю. :)
Заказал intro 4x за 99 евро (для мито и аутосом ребенка - у них вроде нет запрета на детей), посмотрю реальные сроки.

"Get 2 weeks turnaround time for the price of 8 weeks [Limited time offer]"

У них есть обьявление в блоге: Now You Can Get Your Whole Genome Sequenced in Only 2 Weeks With Dante Labs https://www.dantelabs.com/blogs/news/now-you-can-get-your-whole-genome-sequenced-in-only-2-weeks-with-dante-labs?fbclid=IwAR1g1xuXNn6s7VyDm19iVwEaNjvXk_imC6UxYsRAVm0xoLlx3IS3oAHT9sU:
Цитировать
OCT 10, 2019
LONDON -- Dante Labs announced today the official launch of its premium 2-week turnaround time for its whole genome sequencing tests. [...] Dante Labs offers reports and raw data within two weeks from receiving the sample back.

The new service is possible thanks to the new Illumina-backed, high-throughput, automated sequencing centre that Dante Labs built in Italy, fully dedicated to the classical Whole Genome and the WholeGenomeZ™ sequencing tests.

Данте Лабс официально обьявила о 2-х недельной обработке полногеномных тестов. Данте Лабс предлагает отчеты и сырые данные в течение 2-х недель с момента получения образца. Новая услуга стала возможной благодаря новому автоматизированному центру, построенному Данте Лабс в Италии для полногеномных тестов.
Поскольку предложение ограничено во времени, то через некоторое время они вернут разницу в ценах для 2-х недельной и 8-ми недельной обработки образцов. Посмотрим как они справятся, а то у меня один сентябрьский образец месяц висел на контроле качества и только вот вчера или сегодня ушел на секвенирование.
« Последнее редактирование: 12 Октябрь 2019, 20:55:15 от NathanS »

Оффлайн MCB

  • Сообщений: 44
  • Страна: 00
  • Рейтинг +27/-1
Re: Компания Dante Labs
« Ответ #473 : 13 Октябрь 2019, 23:01:11 »
самтулз. Посмотрите на bash скриптик extract23 от Томаса Крана.

... у Dante короткая длина чтения, что обычно критично для выравнивания. И это тоже вызывает ошибки. Для выявления кто прав, я бы смотрел спорные позиции непосредственно в бам файле.
Нет, на самом деле когда я занимался конверсией для закрузки в майхеритидж, то у нас еще не было ни одного бам-файла. Я просто подставлял для тех маркеров,которые отсутствовали в VCF, значения wildtype/wildtype. Ну и еще добавил три СНИПа в конце файла фтДНК, которые картируются и на Х, и на Y и могут служить для определения пола, фейковые значения длы "нужного" пола.
Первый из СНП-профилей "стандартных форматов", сделанных с помощью WGS extract, обработан на мейхеритидж. Формат фтДНК. Несмотря на разницу в примерно 0.5% генотипов с сравнении с моей предудущей "самопальной" экстракцией (на основе VCF, а не БАМ), результаты для обоих экстракций одинаковые. С дальними родственниками совпадения те же до сентиморгана, а в этносоставе те же компоненты с различиями не более чем в 0.4%.

Для сравнения надо иметь в виду, что в "родном" файле от фтДНК, для трех тех же дальних родственников Майхеритидж показал заметно меньшие совпадения ( 249 вместо 256 сМ, 106 вместо 133 сМ, и 70 вместо 85 сМ). И проценты в этносоставе были другие, с отклонениями до 2%. Хотя количество различий в генотипах было примерно такое же (0.5% между WGS Extract и "родным" файлом, 1% между моей собственной экстракцией и "родным" файлом и вдобавок десятки тысяч пропущенных триаллельных маркеров).

Мои предварител;ные выводы по состоверности данных и по механизму сравнения в myHeritage:
1) триаллелики, похоже, алгоритм игнорит
2) СНИПы из "списка фтДНК", по которым идентификация вариантов в разных бейзколлерах дала разные результаты (VCF файл от Данте не содежал соотв. строк, но VCF-файл от WGS Extract показал минорные аллели) - видимо, неинформативные или ненадежные, и их генотипы не сказываются на предсказаниях myHeritage.
3) В общем и целом, Данте реже ошибается в геноптипах, чем чип фтДНК (если предположит. что "больше сентиморганов совпадений" - это правильно, и "более осмысленный этносостав" - тоже)

Оффлайн MCB

  • Сообщений: 44
  • Страна: 00
  • Рейтинг +27/-1
Re: Компания Dante Labs
« Ответ #474 : 14 Октябрь 2019, 19:41:47 »
Пришел емейл от Данте, обещающий, что они сделают BAM / FASTQ файлы доступными с облака, и больше внешние диски для пересылки этих файлoв заказывать будет не надо

Оффлайн bulatv2

  • Сообщений: 191
  • Страна: ru
  • Рейтинг +49/-0
  • ftdna: 468412
  • Y-ДНК: R1a-Z92(YP682+)
  • мтДНК: H1b2
Re: Компания Dante Labs
« Ответ #475 : 14 Октябрь 2019, 20:48:09 »
Пришел емейл от Данте, обещающий, что они сделают BAM / FASTQ файлы доступными с облака, и больше внешние диски для пересылки этих файлoв заказывать будет не надо
и мне написали

Оффлайн Srkz

  • Сообщений: 5473
  • Страна: ru
  • Рейтинг +2255/-2
  • Y-ДНК: N-L1025*
  • мтДНК: U4a1e-pre T16093C T16311T
Re: Компания Dante Labs
« Ответ #476 : 15 Октябрь 2019, 12:14:05 »
Здравствуйте! Кто-нибудь из России получал образец как физ.лицо в последнее время?
История вот какая...
В феврале мы участвовали в акции, купили по скидкой кит. С тех пор постоянно ожидания и бесполезная переписка, при чем пытать вопросами приходится постоянно, иначе тишина и молчание.
Обещали еще в мае выслать повторную пробирку, тк в первый раз якобы не прошла контроль. Затем месяц назад сообщили, что все-таки попытаются выделить днк. Но увы... еще 30 дней дурацкого ожидания. В кабинете при этом статус сменился "ваш новый кит в пути".

На запрос номера для отслеживания тут же получаем:

"Thanks for your purchase on our Website. International shipments to Russia, when directed to an individual, are extremely hard. Russian custom does not make any foreign parcel get into the country unless the final recipient is an enterprise.

It would be great if you could provide us with a VAT ID with the related business name."

К слову, VAT ID был отправлен еще 29.05. Вот мне интересно, реально физ.лица теперь не могут получить пробирки? Если на ип отправлять, растаможка? Стоит оно того??
Кто-нибудь в курсе, сейчас реально получить от них пробирку в Россию? Знакомый раздумывает над приобретением теста. В принципе, там и на юрлицо можно.

PS тоже пообещали письмом сделать доступными из облака файлы, которые в моем случае были доступны из личного кабинета изначально ::)

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34820
  • Страна: ca
  • Рейтинг +3007/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #477 : 15 Октябрь 2019, 16:23:34 »
А я всё равно себе заказал жёсткий диск с данными. По цене с доставкой - он немногим отличается от магазинной цены пустого накопителя.
Всё равно данные надо на что-то скачивать. Пару сотню ГБ (учитывая все файлы) - на компьютере так и так всё время не храню. У меня всего лишь 700 ГБ дискового пространства.
Да, и облако. Сегодня есть. Завтра нет. Причём в нынешних реалиях, доступ к данным могут закрыть одномоментно.

:)

Оффлайн NathanS

  • Сообщений: 161
  • Рейтинг +117/-1
  • Y-ДНК: ЖМ: N1c-Z1939
Re: Компания Dante Labs
« Ответ #478 : 15 Октябрь 2019, 21:10:20 »
А я всё равно себе заказал жёсткий диск с данными. По цене с доставкой - он немногим отличается от магазинной цены пустого накопителя.
Всё равно данные надо на что-то скачивать. Пару сотню ГБ (учитывая все файлы) - на компьютере так и так всё время не храню. У меня всего лишь 700 ГБ дискового пространства.
Да, и облако. Сегодня есть. Завтра нет. Причём в нынешних реалиях, доступ к данным могут закрыть одномоментно.

:)

Если кто-то заботится о месте и сохранности данных, рекоммендую почитать про массивы RAID: https://ru.wikipedia.org/wiki/RAID Поломка жесткого диска случалась со мной 3 раза лет за 15-18. После первой поломки и потери 500 GB, решил перейти на RAID-массивы. (Поломка произошла при включении внешнего диска, четкий щелчок и появился совершенно метрвый диск).

Самый простой уровнь RAID 1 - зеркалировние данных на двух дисках. Если компьютер стационарный, то можно посмотреть инструкцию к материнской плате. Многие даже не профессиональные материнские платы имеют возможность создания RAID 1. Ноутбуки попродвинутей тоже могут иметь возможность установки второго жесткого диска и создания RAID 1.

Также есть NAS https://ru.wikipedia.org/wiki/NAS. Простой компьютер, который подключается к домашней сети, и обеспечивает доступ данных по сети, ну и по USB. Есть шасси с поддержкой RAID 1 и 2-мя местами для дисков. Можно использовать как бэкап для всей семьи. Простые шасси, типа Zyxel NA326, стоят около 100$ плюс стоимость дисков. Есть и полностью готовые решения, например WD My Cloud Home Duo Nas.

Вероятность выхода из строя двух дисков одновременно существенно ниже вероятности выхода из строя одного диска. Массив работает, есть доступ к данным, даже если один диск вышел из строя. Сломавшийся диск, меняется на новый и массив восстанавливается. За 12 лет было 2 поломки дисков в массивах, все восстановил и ничего не потерял. Рекоммендую сразу вложиться в диски - специализированные для NAS держаться лучше. WesternDigital Red NAS 3 TB продается за примерно 100$, нужно минимум два. Если надо больше, то есть диски 14-16 TB. Недостаток, конечно, что приходится платить вдвое за пространство обеспечиваемое одним диском.

PS Про RAID 0 и JBOD знаю. Я использую 9 TB в массиве RAID 5. WGS тесты просто жрут пространство. 118 GB на FASTQ и 119 GB для BAM-файла на один тест, а если делать свое выравнивание, то еще 120 GB на свой BAM-файл, если удалить все промежутичные файлы. 360 GB ушли как с куста.

Оффлайн mdn

  • Сообщений: 116
  • Страна: fi
  • Рейтинг +43/-0
  • Y-ДНК: R-FGC56440
  • мтДНК: R1a1a1
Re: Компания Dante Labs
« Ответ #479 : 16 Октябрь 2019, 10:38:06 »
Заказал intro 4x за 99 евро
Пришло, обратил внимание - на самой пробирке надпись: "Exp: 2020-01-17". То есть срок годности её истекает всего лишь через 3 месяца.
Еще и обратная отправка была "действительно до 2020-01-14". Вроде на их сайте нигде не написано, что всего 3 месяца отведено на анализ? Я чуть было больше не купил, чтобы родственникам отправить - а это бы с полгода точно заняло бы.

Теперь немного волнуюсь про первый кит, который у них заказывал - родственники ничего про срок годности не говорили, а сам пробирку не посмотрел. Там получается впритык к 3 месяцам.
(добавление: проверил серийные номера китов, так тот прошлый был даже чуть новее последнего ;D так что видимо и срок годности у того точно так же до начала 2020)
« Последнее редактирование: 16 Октябрь 2019, 13:48:09 от mdn »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100