АвторТема: Компания Dante Labs  (Прочитано 169635 раз)

0 Пользователей и 3 Гостей просматривают эту тему.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #1035 : 08 Февраль 2020, 07:55:40 »
Такое вот недоразумение высвечивает:


Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #1036 : 08 Февраль 2020, 08:32:17 »
Вспомнил, что надо использовать 19 референс.
Запусти генерирование 23эндМи файла на третьем чипе.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #1037 : 08 Февраль 2020, 18:57:36 »
Такое вот недоразумение высвечивает:
Это одна из старых версий. По ссылке выше сейчас качается версия от 30 января. В последних версиях значительно измененный интерфейс, спутать сложно.

Скачал то на чистый лист именно по Вашей ссылке.
Возможно запускаю не тем ВАТ файлом.

Сейчас перезагружу. И перепроверю.     :)

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #1038 : 08 Февраль 2020, 19:14:56 »
Всё работает.
Наверно ночью тыкал куда-то не туда.    :)

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #1039 : 08 Февраль 2020, 23:46:59 »
Интересно, сколько будет молотить, генерируя файл?
Поди, не меньше суток?      :o

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #1040 : 09 Февраль 2020, 17:38:58 »
Интересно, сколько будет молотить, генерируя файл?
Это уж зависит от производительности ПК, очень по-разному может быть.

Меня беспокоит, что отработку веду непосредственно на хард-драйве. То есть, на террабайтном накопителе.
На самом компьютере 150 свободных ГБ не осталось.   :(

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #1041 : 09 Февраль 2020, 19:37:58 »
Да. Маловато у меня памяти.  :-\
Докачка на диск, естественно, увеличивает время отработки.



Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #1042 : 09 Февраль 2020, 21:45:02 »
Long Reads аутосомный объединённый ВАМ файл по форматам основных лабораторий генерируется уже больше суток.

Дам пока статистику по объединённому WGS файлу. Потом сравню, что лучше.   :)




GEDmatch Genesis DNA file diagnostic utility
Kit LG4772377
Kit LG4772377 was uploaded on 2019-05-28 15:18:52 (UTC)
Kit LG4772377 has a source of Dante Labs
Kit LG4772377 has public access of Yes

Status: Good

Kit was tokenized on 2019-05-28 10:20:28 (UTC)
V2 Token file size: 6776507.
This kit should be available for one-to-one comparisons.

Kit was tokenized(slim) on 2019-05-28 10:20:28 (UTC)
V2 Token file size(slim): 5027232.
Kit LG4772377 was batch processed on 2019-05-29 08:47:01 (UTC)

Source of kit is Dante Labs
Number of original snps is 1675814
Chr   Token   SlimToken
1   105679   78506
2   109375   80460
3   90869   66356
4   82609   61852
5   80834   58571
6   89764   68736
7   73283   54289
8   69915   51265
9   60254   43918
10   70108   51585
11   66035   47959
12   65111   47189
13   49854   36321
14   43876   32564
15   41048   29739
16   43007   31261
17   38017   27544
18   40365   29332
19   27754   20407
20   33813   24502
21   19417   14347
22   19997   14451
23   33194   33190

Usable SNPS is 1354178.
Usable SNPS(slim) is 1004344.
Slimmed by 25.8 Pct.
Total matches in for all kits in Database: 1437514451904

Total matches with kit LG4772377 = 17441 = 1.2132747588659E-6 Pct. of all matches in the entire Genesis database.



Status: Good

FINISHED

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #1043 : 09 Февраль 2020, 21:46:31 »
Что в данном контексте означает slim?

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #1044 : 09 Февраль 2020, 21:50:58 »
Для сравнения 23эндМи (объединённые второй и третий чип):



GEDmatch Genesis DNA file diagnostic utility
Kit M205801
Kit M205801 was uploaded on 2011-02-11 21:15:58 (UTC)
Kit M205801 has a source of Migration - V3 - M
Kit M205801 has public access of Yes

Status: Good

Kit was tokenized on 2018-03-21 23:07:36 (UTC)
V2 Token file size: 4586357.
This kit should be available for one-to-one comparisons.

Kit was tokenized(slim) on 2018-09-30 18:41:26 (UTC)
V2 Token file size(slim): 3171472.
Kit M205801 was batch processed on 2018-11-04 04:37:21 (UTC)

Source of kit is Migration - V3 - M
Number of original snps is 917169
Chr   Token   SlimToken
1   72224   50424
2   74230   50894
3   61062   41285
4   53999   37640
5   54903   36825
6   60722   41719
7   48785   33824
8   48405   33102
9   42094   28692
10   48753   33576
11   45525   30796
12   44863   30356
13   35037   23854
14   29856   20685
15   27457   18492
16   28070   18925
17   24478   16410
18   27268   18430
19   17101   11703
20   23063   15591
21   13102   9128
22   13468   9137
23   22704   22704

Usable SNPS is 917169.
Usable SNPS(slim) is 634192.
Slimmed by 30.9 Pct.
Total matches in for all kits in Database: 1437514451904

Total matches with kit M205801 = 28831 = 2.0056146191653E-6 Pct. of all matches in the entire Genesis database.



Status: Good

FINISHED


Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Компания Dante Labs
« Ответ #1045 : 09 Февраль 2020, 21:53:08 »
И ФТДНА:

GEDmatch Genesis DNA file diagnostic utility
Kit T792968
Kit T792968 was uploaded on 2016-05-13 04:15:19 (UTC)
Kit T792968 has a source of Migration - F2 - T
Kit T792968 has public access of Yes

Status: Good

Kit was tokenized on 2018-03-23 23:45:19 (UTC)
V2 Token file size: 3343272.
This kit should be available for one-to-one comparisons.

Kit was tokenized(slim) on 2018-10-01 03:54:35 (UTC)
V2 Token file size(slim): 2312952.
Kit T792968 was batch processed on 2018-11-18 08:14:04 (UTC)

Source of kit is Migration - F2 - T
Number of original snps is 668552
Chr   Token   SlimToken
1   53691   37614
2   53235   36540
3   43899   29825
4   38037   26444
5   39269   26267
6   44333   30421
7   35157   24419
8   34646   23741
9   30642   20856
10   36136   24888
11   33739   22836
12   32878   22250
13   25701   17567
14   21767   15120
15   20241   13633
16   20863   14078
17   18376   12371
18   20075   13608
19   13474   9189
20   17021   11515
21   9636   6720
22   9644   6494
23   16092   16092

Usable SNPS is 668552.
Usable SNPS(slim) is 462488.
Slimmed by 30.8 Pct.
Total matches in for all kits in Database: 1437514451904

Total matches with kit T792968 = 27787 = 1.9329892623477E-6 Pct. of all matches in the entire Genesis database.



Status: Good

FINISHED

Оффлайн mdn

  • Сообщений: 263
  • Страна: fi
  • Рейтинг +142/-0
  • Y-ДНК: R-FGC56440
  • мтДНК: R1a1a1
Re: Компания Dante Labs
« Ответ #1046 : 10 Февраль 2020, 12:33:09 »
Новый кит прошел обработку, Sequencing Started 23 января, файлы появились сегодня ночью.
Сам кит был новый Isohelix, cо сроком годности до 2023 года.

Чётко 90.3 гигабаз. :) Немного обидно, я надеялся, что мне как-то повезёт, и выдадут больше 100 хотя бы.
В BAM от самих Dante - 54% mapped чтений, то есть на самом 49 гигабаз и примерно 16х-17х.
Зубы почищенные, рот прополощен, полчаса выждано, качественно взболтана бутылочка с житкостью, что еще им надо??? Человек тот же, который за неделю до этого 95% mapped получил. ;D (хотел получить 60х, ну вот 45х видимо будет :) )
При самостоятельном выравнивании minimap2 на глаз как раз примерно половина unmapped.

Вроде есть инструкция, как можно попробовать определить эту бактерию - наверное попробую.

Отчёт fastp:
Summary
General
fastp version:   0.20.0 (https://github.com/OpenGene/fastp)
sequencing:   paired end (151 cycles + 151 cycles)
mean length before filtering:   147bp, 147bp
mean length after filtering:   147bp, 147bp
duplication rate:   6.305746%
Insert size peak:   261

Before filtering
total reads:   611.488130 M
total bases:   90.389334 G
Q20 bases:   88.050328 G (97.412298%)
Q30 bases:   83.898663 G (92.819207%)
GC content:   42.854954%

After filtering
total reads:   607.427852 M
total bases:   89.713981 G
Q20 bases:   87.597616 G (97.640987%)
Q30 bases:   83.526238 G (93.102811%)
GC content:   42.818564%

Filtering result
reads passed filters:   607.427852 M (99.336001%)
reads with low quality:   3.855382 M (0.630492%)
reads with too many N:   23.206000 K (0.003795%)
reads too short:   181.690000 K (0.029713%)

Оффлайн mladshij

  • Сообщений: 801
  • Страна: ru
  • Рейтинг +119/-0
  • Darth Vader
  • Y-ДНК: R1a-Z92 -> YP569 -> Y85137
  • мтДНК: H1
Re: Компания Dante Labs
« Ответ #1047 : 10 Февраль 2020, 12:34:43 »
Появились у меня файлы для скачивания. Пока скачать не могу, но размер меня уже смущает: два FASTQ по 21 гигабайта - это же маловато будет? Ну и BAM всего на 42 гигабайта.

Вечером скачаю их и проверю сколько там гигабаз.

Оффлайн Farharaji

  • Сообщений: 984
  • Страна: aq
  • Рейтинг +170/-7
    • Ytree YF71444
  • Y-ДНК: R1b-DF98+FT22607+BY20662+
  • мтДНК: U5b1e1*
Re: Компания Dante Labs
« Ответ #1048 : 10 Февраль 2020, 13:00:22 »
У меня уже появились файлы Данте лабс. Хотя официально они все еще в "процессе". А что теперь с ними делать? Какой файл в yfull отправлять? или несколько?

Indel (TBI)
Indel (VCF)
SNP (TBI)
SNP (VCF)
SV (VCF)
SV (TBI)
CNV (TBI)
CNV (VCF)
А, их же на гигабазы надо проверить сначала, а какой файл проверять? или все

Оффлайн mdn

  • Сообщений: 263
  • Страна: fi
  • Рейтинг +142/-0
  • Y-ДНК: R-FGC56440
  • мтДНК: R1a1a1
Re: Компания Dante Labs
« Ответ #1049 : 10 Февраль 2020, 13:44:04 »
У меня уже появились файлы Данте лабс. Хотя официально они все еще в "процессе". А что теперь с ними делать? Какой файл в yfull отправлять? или несколько?

Indel (TBI) Indel (VCF) SNP (TBI) SNP (VCF) SV (VCF) SV (TBI) CNV (TBI) CNV (VCF)
Это пока только сильно отфильтрованные SNP, еще 3 файла должно появиться скоро - BAM и FASTQ R1 и FASTQ R2.
Вот с ними уже можно работать будет, а это так, по быстрому посмотреть.

Хотя из них как раз можно митогаплогруппу достать, если интересно.
Для этого надо из SNP (VCF) оставить только заголовок и MT записи, и залить на https://haplogrep.i-med.ac.at/app/index.html
« Последнее редактирование: 10 Февраль 2020, 14:02:38 от mdn »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.