АвторТема: Компания Dante Labs  (Прочитано 29694 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн NathanS

  • Сообщений: 159
  • Рейтинг +114/-1
  • Y-ДНК: ЖМ: N1c-Z1939
Re: Компания Dante Labs
« Ответ #420 : 03 Сентябрь 2019, 20:38:07 »
Писем не писал. Вопросов не задавал. Сами ответили.     :)


Цитировать
Hi -

Where is your kit?

Andrea
Ну, насколько я понял, такие "письма счастья" пришли каждому, чьи результаты ещё не готовы. Увы, мне тоже.

У меня всё готово давным давно, но я тоже получил это письмо. Есть, правда, неиспользованные наборы.

Оффлайн Farharaji

  • Сообщений: 179
  • Страна: kz
  • Рейтинг +20/-5
  • Y-ДНК: R1b DF98>S18823
Re: Компания Dante Labs
« Ответ #421 : 25 Сентябрь 2019, 23:53:12 »
А что за новая услуга у них. Интро 4x за 99. Там только о питании? а игрек хромосому читают?

Оффлайн mdn

  • Сообщений: 106
  • Страна: fi
  • Рейтинг +38/-0
  • Y-ДНК: R-FGC56440
  • мтДНК: R1a1a1
Re: Компания Dante Labs
« Ответ #422 : 29 Сентябрь 2019, 11:39:33 »
А что за новая услуга у них. Интро 4x за 99. Там только о питании? а игрек хромосому читают?
Судя по тексту - там всё еще весь геном, то есть Y тоже есть. Но можно ли верить всего лишь 4х чтению? Это мой вопрос. Создалось впечатление после чтения этого форума, что даже 10х - недостаточно для уверенности в полученных данных.
Всё-таки весь геном, и по цене чуть дороже, чем просто аутосомный.
Цена 99 - это как бы скидка со 199, но скорее пожизненная, и на распродажах будет еще дешевле.

Также они прямо при заказе теперь дают выбрать срок, 8 недель - "обычная" цена, 2 недели - в полтора раза дороже.

Оффлайн DmitroR-2

  • Сообщений: 769
  • Страна: ru
  • Рейтинг +239/-1
Re: Компания Dante Labs
« Ответ #423 : 29 Сентябрь 2019, 11:57:29 »
Однозначно нужно подождать до Чёрной Пятницы, и взять 30X. Если и не будет повторения цены в 199$, то что-то в районе 250$ вполне может быть.

Оффлайн mdn

  • Сообщений: 106
  • Страна: fi
  • Рейтинг +38/-0
  • Y-ДНК: R-FGC56440
  • мтДНК: R1a1a1
Re: Компания Dante Labs
« Ответ #424 : 29 Сентябрь 2019, 12:47:16 »
Однозначно нужно подождать до Чёрной Пятницы, и взять 30X. Если и не будет повторения цены в 199$, то что-то в районе 250$ вполне может быть.
Да, почитал разные статьи (например, 1 и 2) - 4х означает, что реальный уровень запросто может быть где-нибудь 3.1-3.5х, и за счёт коротких чтений - будет много просто отсутствующих частей, много будет прочитано всего лишь дважды, а что-то будет прочитано 10 раз (причём ошибки чтения не исключены). И в итоге покрытие, которому можно будет доверять - будет сильно рваным.

И примет ли его вообще YFull, например, или посчитает вообще всё невалидным. ;D И в итоге максимум, что можно будет делать - это какими-нибудь специальными программами лично для себя "примерно" добыть данные, без возможности залить вообще куда-то.

А я уж думал попробовать один интересный мне митоднк так добыть. Хотя еще не уверен, может и рискну.
« Последнее редактирование: 29 Сентябрь 2019, 12:58:45 от mdn »

Оффлайн NathanS

  • Сообщений: 159
  • Рейтинг +114/-1
  • Y-ДНК: ЖМ: N1c-Z1939
Re: Компания Dante Labs
« Ответ #425 : 29 Сентябрь 2019, 18:50:03 »
И примет ли его вообще YFull, например, или посчитает вообще всё невалидным. ;D И в итоге максимум, что можно будет делать - это какими-нибудь специальными программами лично для себя "примерно" добыть данные, без возможности залить вообще куда-то.

Со страницы yfull.com:
Цитировать
Технические требования: .BAM-файл; глубина покрытия минимум 15X; длина рида минимум 100bp

Оффлайн TK

  • Сообщений: 393
  • Страна: ru
  • Рейтинг +267/-0
Re: Компания Dante Labs
« Ответ #426 : 01 Октябрь 2019, 13:57:23 »
Решил чуть смоделировать ситуацию 4x для анализа Y-ДНК.
Для этого вырезал из примера 30x BAM файла производства Dante Labs (полученном на оборудовании BGI, и да - 150 bp) рандомно куски, чтобы получить покрытие 4x.
Я использовал samtools view -s 0.133, но правильнее было бы конечно резать раньше, на уровне FastQ (я только не придумал, как учесть парность).

В-общем, для примера - у приватных снипов и снипов уровня верхнего субклада (это пример!) статистика по количеству прочтений примерно такая:

Из 42 снипов:
8  - вообще не прочитаны
10 - имеют только 1 прочтение (но все совпадают)
24 - имеют 2 и более (до 5) прочтений (также все совпадают).

Для снипов, попадающих в регион Y-ДНК, учитываемый в YFull для определения возраста, статистика примерно такая:

Меньшее количество вообще не прочитанных снипов, вероятно, объясняется более хорошим качеством регионов (для возраста) для маппирования.
Из 20 снипов не прочитаны вообще только 2, остальные (прочитанные) совпали (разумеется) с исходным .bam файлом.

По идее, не самый плохой результат!
Получается, что примерно половина снипов читается на уровне не хуже 2-х прочтений.
Вероятно, такое вполне можно использовать, по крайней мере, для первичного анализа дальних родственников - похоже, вполне можно будет примерно оценить дальность родства, правда, точность (из учёта точности на снип) скорее будет в районе 200-300 лет.
И, разумеется, едва ли это будет пригодно для выделения новых приватных снипов, но мне лень пока делать такой анализ.

P.S. Да, забыл сказать - mtDNA, разумеется, осталась в превосходном количестве прочтений (ну что такое 1000х против 7000х - в-общем же, один фиг дофига прочтений :)

Хм, ещё дополнение про mtDNA - выборочно глянул - скорее речь о 300 прочтениях против примерно 2000. Но всё равно снипы можно корректно выделить.
Единственное замечание - в готовом виде в RSRS или rCRS вам никто mtDNA не предоставит - надо будет самим обрабатывать и считать, а нумерация снипов там немного может отличаться в зависимости от маппирования - и это также надо будет учесть.
« Последнее редактирование: 01 Октябрь 2019, 14:27:43 от TK »

Оффлайн MCB

  • Сообщений: 44
  • Страна: 00
  • Рейтинг +27/-1
Re: Компания Dante Labs
« Ответ #427 : 02 Октябрь 2019, 22:40:21 »
mtDNA, разумеется, осталась в превосходном количестве прочтений
Это надо из бам файла вытаскивать, или в vcf где-то есть мтДНК? В хедере файла я вижу
##contig=<ID=chrM,length=16571,assembly=hg19>
но более нигде chrM не видна?

Оффлайн Srkz

  • Сообщений: 5466
  • Страна: ru
  • Рейтинг +2240/-2
  • Y-ДНК: N-L1025*
  • мтДНК: U4a1e-pre T16093C T16311T
Re: Компания Dante Labs
« Ответ #428 : 03 Октябрь 2019, 05:35:51 »
Это надо из бам файла вытаскивать, или в vcf где-то есть мтДНК? В хедере файла я вижу
##contig=<ID=chrM,length=16571,assembly=hg19>
но более нигде chrM не видна?
У меня vcf с мито

Оффлайн TK

  • Сообщений: 393
  • Страна: ru
  • Рейтинг +267/-0
Re: Компания Dante Labs
« Ответ #429 : 03 Октябрь 2019, 13:00:29 »
Это надо из бам файла вытаскивать, или в vcf где-то есть мтДНК? В хедере файла я вижу
##contig=<ID=chrM,length=16571,assembly=hg19>
но более нигде chrM не видна?
У меня vcf с мито
Я один фиг генерил BAM самостоятельно - коли есть FASTQ, то лучше всегда самому исходные данные обрабатывать.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34798
  • Страна: ca
  • Рейтинг +2998/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #430 : 03 Октябрь 2019, 18:51:20 »
Я один фиг генерил BAM самостоятельно - коли есть FASTQ, то лучше всегда самому исходные данные обрабатывать.

Жаль, что раньше не сказали.
Заказывал и получал ВАМ файлы. Как-то думалось, что это и есть исходники. Из которых генерируют тот же FASTQ.

Оффлайн MCB

  • Сообщений: 44
  • Страна: 00
  • Рейтинг +27/-1
Re: Компания Dante Labs
« Ответ #431 : 03 Октябрь 2019, 22:21:48 »
Это надо из бам файла вытаскивать, или в vcf где-то есть мтДНК? В хедере файла я вижу
##contig=<ID=chrM,length=16571,assembly=hg19>
но более нигде chrM не видна?
У меня vcf с мито
С контигом, обозначенным именно chrM? Проверил в трех имеющихся на руках -WGZ.snp.vcf.gz файлах - ни в одном нету (правда, потом сообразил, что в данных от 23andMe тоже есть мой подробный мт-генотип, сличил те данные с YFull, и понял, что там за субклада).

Так-то основное (и достаточно дебильное по смыслу), что я пока сделал с Дантевскими данными - это переводил в формат фтДНК и загружал на MyHeritage. Исходный план был грандиознее - сравнить полногеномные данные по совпадающим сегментам с "дальними совпаденцами", чтобы по частоте различий в геномных данных независимости оценить время расхождения - но только никто из таких совпаденцев не клюнул, да и фазировка редких вариантов оказалась практически недоступной в данных Данте :(

Оффлайн Srkz

  • Сообщений: 5466
  • Страна: ru
  • Рейтинг +2240/-2
  • Y-ДНК: N-L1025*
  • мтДНК: U4a1e-pre T16093C T16311T
Re: Компания Dante Labs
« Ответ #432 : 04 Октябрь 2019, 06:02:24 »
С контигом, обозначенным именно chrM? Проверил в трех имеющихся на руках -WGZ.snp.vcf.gz файлах - ни в одном нету (правда, потом сообразил, что в данных от 23andMe тоже есть мой подробный мт-генотип, сличил те данные с YFull, и понял, что там за субклада).
Да, так. Оттуда и взял мутацию T16093C, в остальном совпало с определённой 23andMe U4a1a. Видимо, какая-то разница в продуктах, зато BAM уменьшенный ;D Брал на Чёрную Пятницу.

Я один фиг генерил BAM самостоятельно - коли есть FASTQ, то лучше всегда самому исходные данные обрабатывать.
Пока так и не дошли руки. Всё равно игрек и аутосомы у меня сделаны ранее, а мито посмотрел по vcf.

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5266
  • Страна: hr
  • Рейтинг +2559/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Компания Dante Labs
« Ответ #433 : 04 Октябрь 2019, 07:27:44 »
а мито посмотрел по vcf.
Цитировать
##contig=<ID=chrM,length=16571,assembly=hg19>
Судя по указанному контигу, мито выравнивалось по рефу йоруба, там позиции несколько отличаются от принятого везде rCRS или RSRS (в некоторых позициях сдвиг на два нуклеотида). Есть табличка соответствий для перегонки значений.

В VCF от Данте вроде всегда должно быть мито.
С VCF удобнее работать через bcftools, предварительно создав индекс.

Оффлайн Srkz

  • Сообщений: 5466
  • Страна: ru
  • Рейтинг +2240/-2
  • Y-ДНК: N-L1025*
  • мтДНК: U4a1e-pre T16093C T16311T
Re: Компания Dante Labs
« Ответ #434 : 04 Октябрь 2019, 08:19:51 »
Судя по указанному контигу, мито выравнивалось по рефу йоруба, там позиции несколько отличаются от принятого везде rCRS или RSRS (в некоторых позициях сдвиг на два нуклеотида). Есть табличка соответствий для перегонки значений.
Да, там были сдвиги при сравнении с деревом YFull и файлом от 23andMe. 16093 это с вычетом единички, т.к. в ближайших позициях был сдвиг на 1 и внутри U4a1 как раз есть ветвь с этим снипом. С поиском таблицы поленился заморачиваться.

PS онлайн-предиктор https://dna.jameslick.com/mthap/ сдвиги корректно распознал (создавал текстовый файл формата 23andMe),
« Последнее редактирование: 04 Октябрь 2019, 08:54:19 от Srkz »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100