АвторТема: Компания Dante Labs  (Прочитано 27218 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34668
  • Страна: ca
  • Рейтинг +2966/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #240 : 07 Январь 2019, 21:47:24 »
Типа, вот такой хреньки:


Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34668
  • Страна: ca
  • Рейтинг +2966/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #241 : 07 Январь 2019, 21:48:55 »
Причём речь идёт только о родных файлах от ДНАлэнд, живущих на их сервере.     :-X


*** Пойду проверю, можно ли воткнуть VCF файл в Geni.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34668
  • Страна: ca
  • Рейтинг +2966/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #242 : 07 Январь 2019, 22:00:55 »
Из сторонних лаб Geni принимает только ФТДНА.


*** Пошёл пробовать MyHeritage.     :)

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34668
  • Страна: ca
  • Рейтинг +2966/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #243 : 07 Январь 2019, 22:06:21 »
Пошёл пробовать MyHeritage.     :)

Это было быстро. От ворот поворот.

Поддерживаемые компании: Ancestry, FamilyTreeDNA, 23andMe, Living DNA.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34668
  • Страна: ca
  • Рейтинг +2966/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #244 : 07 Январь 2019, 22:33:29 »
Резюмирую.

Не считая болячек (вполне устраивает родной отчёт от ДантеЛабз), файл VCF удалось присобачить только в ГедМатч Генезис.
Да, и то, пока только частично. Мои данные в других аккаунтах не показываются. За исключением опции One-to-One.

Увы...

:(

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34668
  • Страна: ca
  • Рейтинг +2966/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #245 : 08 Январь 2019, 17:41:48 »
В параллельной теме напостил десяток сообщений, а потом вывод:


И ВБОП не тот (6.3 поколения против 7.2).
И позиции на хромосомах другие.

Вывод: данные от Данте Лабз, загруженные в ГедМатч, отличаются от других лабораторий. Как для этнокалькуляторов. Так и для оценки родства.


Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 34668
  • Страна: ca
  • Рейтинг +2966/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #246 : 09 Январь 2019, 00:03:36 »
Вопрос к знающим людям: можно ли из VCF файла вытащить мито?
Если да, то как?
Какого качества?

Заранее спасибо за подсказки.

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5246
  • Страна: hr
  • Рейтинг +2511/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Компания Dante Labs
« Ответ #247 : 09 Январь 2019, 06:41:18 »
То есть, если данные ФТДНА и 23эндМи коррелируют друг с другом (тот же порядок популяций в десятке, с небольшими флюктуациями по дистанциям). То данные от Данте Лабз - явно кривые. Чудные популяции. Огромные дистанции.

Незачёт.    :-\
Дело в том, что в файлах VCF исключены те снипы, где значения совпадают с референсом. Если бы Gedmatch Genesis их добавили, получилось бы близко к FTDNA/23andMe. Данте Лабз можно обвинить только в том, что не хотят предоставлять клиентам файл в нужном формате по умолчанию, но сами данные должны быть нормальными.
В принципе можно _легко_ сделать файл типа 23andMe для корректной загрузки на гедматч из bam файла от Данте.
Совместно с уважаемым Daemon2017 мы составили небольшую инструкцию как вырезать из bam'а Y и MT на компьютере с Win 10. Можно дополнить и тем как создать VCF для загрузки на Гедматч.
Беда только в том, что инструкция состоит из картинок и наборов технических фраз. Возможно кто-то "причешет" ее?)))
Думаю это поможет всем клиентам Данте.

Оффлайн Srkz

  • Сообщений: 5443
  • Страна: ru
  • Рейтинг +2208/-2
  • Y-ДНК: N-L1025*
  • мтДНК: U4a1e-pre T16093C T16311T
Re: Компания Dante Labs
« Ответ #248 : 09 Январь 2019, 07:40:59 »
]В принципе можно _легко_ сделать файл типа 23andMe для корректной загрузки на гедматч из bam файла от Данте.
Совместно с уважаемым Daemon2017 мы составили небольшую инструкцию как вырезать из bam'а Y и MT на компьютере с Win 10. Можно дополнить и тем как создать VCF для загрузки на Гедматч.
Беда только в том, что инструкция состоит из картинок и наборов технических фраз. Возможно кто-то "причешет" ее?)))
Думаю это поможет всем клиентам Данте.

Присылайте мне. Вот только в ближайшее время скорее всего заняться ей не получится, так как на мне сейчас два достаточно объёмных дела, и ко второму ещё даже не приступал ;D Может быть, кто-то более оперативно сработает.

В прошлом году я делал файл аутосомы + X формата FTDNA на основе VCF от YSeq, но специфическими наколенными методами, инструкцию для использования на их основе не составить. После добавления отсутствующих снипов из референса результаты этнокалькуляторов полностью нормализовались, но вот поиск родственников, как по мне, стал даже хуже - часть сегментов разорвалась.

Оффлайн gecube_ru

  • Сообщений: 1005
  • Страна: ru
  • Рейтинг +165/-0
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Re: Компания Dante Labs
« Ответ #249 : 09 Январь 2019, 08:58:08 »
То есть, если данные ФТДНА и 23эндМи коррелируют друг с другом (тот же порядок популяций в десятке, с небольшими флюктуациями по дистанциям). То данные от Данте Лабз - явно кривые. Чудные популяции. Огромные дистанции.

Незачёт.    :-\
Дело в том, что в файлах VCF исключены те снипы, где значения совпадают с референсом. Если бы Gedmatch Genesis их добавили, получилось бы близко к FTDNA/23andMe. Данте Лабз можно обвинить только в том, что не хотят предоставлять клиентам файл в нужном формате по умолчанию, но сами данные должны быть нормальными.
В принципе можно _легко_ сделать файл типа 23andMe для корректной загрузки на гедматч из bam файла от Данте.
Совместно с уважаемым Daemon2017 мы составили небольшую инструкцию как вырезать из bam'а Y и MT на компьютере с Win 10. Можно дополнить и тем как создать VCF для загрузки на Гедматч.
Беда только в том, что инструкция состоит из картинок и наборов технических фраз. Возможно кто-то "причешет" ее?)))
Думаю это поможет всем клиентам Данте.
да сделайте же, в конце-концов, скрипт на том же python.
Есть возможность его выложить на хостинг, чтобы в онлайне данные обрабатывались.

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5246
  • Страна: hr
  • Рейтинг +2511/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Компания Dante Labs
« Ответ #250 : 09 Январь 2019, 09:13:52 »
да сделайте же, в конце-концов, скрипт на том же python.
Есть возможность его выложить на хостинг, чтобы в онлайне данные обрабатывались.
На хостинг, чтоб гонять через него 100-120Гб файлы?))

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5246
  • Страна: hr
  • Рейтинг +2511/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Компания Dante Labs
« Ответ #251 : 09 Январь 2019, 10:22:32 »
]В принципе можно _легко_ сделать файл типа 23andMe для корректной загрузки на гедматч из bam файла от Данте.
Совместно с уважаемым Daemon2017 мы составили небольшую инструкцию как вырезать из bam'а Y и MT на компьютере с Win 10. Можно дополнить и тем как создать VCF для загрузки на Гедматч.
Беда только в том, что инструкция состоит из картинок и наборов технических фраз. Возможно кто-то "причешет" ее?)))
Думаю это поможет всем клиентам Данте.

Присылайте мне. Вот только в ближайшее время скорее всего заняться ей не получится, так как на мне сейчас два достаточно объёмных дела, и ко второму ещё даже не приступал ;D Может быть, кто-то более оперативно сработает.

В прошлом году я делал файл аутосомы + X формата FTDNA на основе VCF от YSeq, но специфическими наколенными методами, инструкцию для использования на их основе не составить. После добавления отсутствующих снипов из референса результаты этнокалькуляторов полностью нормализовались, но вот поиск родственников, как по мне, стал даже хуже - часть сегментов разорвалась.
Набросок руководства тут.

Оффлайн Srkz

  • Сообщений: 5443
  • Страна: ru
  • Рейтинг +2208/-2
  • Y-ДНК: N-L1025*
  • мтДНК: U4a1e-pre T16093C T16311T
Re: Компания Dante Labs
« Ответ #252 : 09 Январь 2019, 10:34:35 »
Набросок руководства тут.
Отлично ) Хорошо бы ещё часть про создание файла 23andMe/FTDNA

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5246
  • Страна: hr
  • Рейтинг +2511/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Компания Dante Labs
« Ответ #253 : 09 Январь 2019, 10:42:59 »
Набросок руководства тут.
Отлично ) Хорошо бы ещё часть про создание файла 23andMe/FTDNA
Томас Кран из YSEQ написал скрипт, который надо будет запускать из окружения Linux.
Он работает с hg19, то есть подходит для Dante Lab "из коробки". Я переписал его, модифицировав для работы с hg38. Если надо будет, то поищу.
Работа со скриптом подробно описана, но если будут вопросы, то помогу.
https://github.com/tkrahn/extract23
Из минусов - из результатов исключены инделы, но это мелочь

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Модератор
  • *****
  • Сообщений: 5246
  • Страна: hr
  • Рейтинг +2511/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Компания Dante Labs
« Ответ #254 : 09 Январь 2019, 12:06:00 »
Он работает с hg19, то есть подходит для Dante Lab "из коробки". Я переписал его, модифицировав для работы с hg38. Если надо будет, то поищу.
Работа со скриптом подробно описана, но если будут вопросы, то помогу.
Также есть возможность создать свой набор снипов аля molgen.vcf v1)))

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100