АвторТема: FTDNA начала принимать более новые файлы 23andme и AncestryDNA  (Прочитано 16484 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
У меня бесплатная версия показывала только небольшое кол-во наиболее близких родственников.

И так, скорее всего, будет всегда.

Лень печатать одно и то же. Поэтому просто выдеру своё сообщение из лички (отвечал на вопрос, как такое может быть, что по бесплатным аккаунтам результатов мало):

Да, просто.
Вся база просматривается на совпадения.
Затем перетряхивается. Т.е., найденные совпадения добавляются и в другие аккаунты.
По бесплатным аккаунтам, допустим, стоит меньшее тайм аут. Затем выставляется флаг отработки не по прохождении всей базы. А именно по исчерпанию отведённого на отработку времени.

Это как вариант программного косяка.

Мне же кажется, что имеет место злонамеренная экономия ресурсов.     :)


*** Суть не в том.
Свои гаплотипы с 23эндМи я залил и в ГедМатч, и в ФТДНА, и в ДНАлэнд. Кое-что даже в Джини и МайЭритидж.

Оффлайн gecube_ru

  • Сообщений: 1418
  • Страна: hu
  • Рейтинг +264/-6
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
У меня бесплатная версия показывала только небольшое кол-во наиболее близких родственников.

И так, скорее всего, будет всегда.

Лень печатать одно и то же. Поэтому просто выдеру своё сообщение из лички (отвечал на вопрос, как такое может быть, что по бесплатным аккаунтам результатов мало):

Да, просто.
Вся база просматривается на совпадения.
Затем перетряхивается. Т.е., найденные совпадения добавляются и в другие аккаунты.
По бесплатным аккаунтам, допустим, стоит меньшее тайм аут. Затем выставляется флаг отработки не по прохождении всей базы. А именно по исчерпанию отведённого на отработку времени.

Это как вариант программного косяка.

Мне же кажется, что имеет место злонамеренная экономия ресурсов.     :)


*** Суть не в том.
Свои гаплотипы с 23эндМи я залил и в ГедМатч, и в ФТДНА, и в ДНАлэнд. Кое-что даже в Джини и МайЭритидж.

Я думаю, что в первую очередь дело в том, что для переносов они не показывают спекулятивную родню. Она появится только после доплаты, ИМХО

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
У FTDNA, насколько я знаю, no-calls обычно в пределах 3%. Где-то читал, что их контроль качества проверяет, чтобы было 97% считано как минимум. 22% – это вообще мусор получается, а не тест, какое там родство...

А Вы откройте два старых файла текстовым редактором. И пробегитесь по позициям.

3% - это инструментальная ошибка.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Давайте вместе посмотрим два гаплотипа, сделанных на одной и той же панели в одно и то же время. Самое начало. Для понимания.    :)

Номер, раз:

# rsid   chromosome   position   genotype
rs3094315   1   742429   AA
rs12562034   1   758311   GG
rs3934834   1   995669   CC
rs9442372   1   1008567   GG
rs3737728   1   1011278   GG
rs11260588   1   1011521   GG
rs6687776   1   1020428   CC
rs9651273   1   1021403   GG
rs4970405   1   1038818   AA


Номер двас:

# rsid   chromosome   position   genotype
rs4477212   1   82154   AA
rs3094315   1   752566   AG
rs3131972   1   752721   AG
rs12124819   1   776546   AG
rs11240777   1   798959   AG
rs6681049   1   800007   CC
rs4970383   1   838555   AC
rs4475691   1   846808   CC
rs7537756   1   854250   AA

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Чтобы вручную не возиться, найдите старую утилитку по сравнению двух текстовых файлов.
Потом поглядите на размеры (количество строк) исходников. И на количество строк сгенерированного файла отличий.

Оффлайн gecube_ru

  • Сообщений: 1418
  • Страна: hu
  • Рейтинг +264/-6
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Вы дали "сырые" данные в разных билдах генома человека. Напрямую, ес-но, они несравнимые:

http://forums.familytreedna.com/archive/index.php/t-38765.html
Цитировать
Each Build is a versions of human genome reference

As advancements in Science into the Human Genome are made, these references are adjusted

Each SNP has a reference position on our Genome, each build fine tunes so to speak their position.

For instance SNP rs3094315 in Build 36 Raw Data is given the position of 742429 on Chromosome 1, in build 37 it is given the position of 752566.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Я просто в Гедматч увидел утилиту "DNA File Diagnostic Utility", и она мне выдала "No-calls = 16558 = 2.3307962685863 percent". Ну раз 22, так 22.

Допускаю, что ГедМатч вкладывает в ноу-коллз другие смыслы.
Типа, помимо непрочитанных позиций, имеем ещё проблемы собственно вычитки исходного файла.     ???

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
А тут что именно не так? Снипы-то разные из двух образцов, и аллели, соответственно, разные. Позиции разные у них, даже если названия совпадают. Это разные сборки.

Вбиваем rs3094315 в текстовый поиск для второго файла. Отсутствует!
Соответственно rs4477212 отсутствует в первом файле.

Панель V2 для обоих.

Оффлайн gecube_ru

  • Сообщений: 1418
  • Страна: hu
  • Рейтинг +264/-6
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Еще раз - БИЛД ГЕНОМА РАЗНЫЙ. Одни snp  в разных позициях и пр. "странности"

Оффлайн Srkz

  • Сообщений: 8462
  • Страна: ru
  • Рейтинг +4812/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Давайте вместе посмотрим два гаплотипа, сделанных на одной и той же панели в одно и то же время. Самое начало. Для понимания.    :)

Номер, раз:

# rsid   chromosome   position   genotype
rs3094315   1   742429   AA
rs12562034   1   758311   GG
rs3934834   1   995669   CC
rs9442372   1   1008567   GG
rs3737728   1   1011278   GG
rs11260588   1   1011521   GG
rs6687776   1   1020428   CC
rs9651273   1   1021403   GG
rs4970405   1   1038818   AA


Номер двас:

# rsid   chromosome   position   genotype
rs4477212   1   82154   AA
rs3094315   1   752566   AG
rs3131972   1   752721   AG
rs12124819   1   776546   AG
rs11240777   1   798959   AG
rs6681049   1   800007   CC
rs4970383   1   838555   AC
rs4475691   1   846808   CC
rs7537756   1   854250   AA

А тут что именно не так? Снипы-то разные из двух образцов, и аллели, соответственно, разные.
Здесь два разных набора снипов. Первый тест это панель 23andMe версия 2, второй тест - версия 3. Не удивлюсь, если и образцы разные.
Про 22 процента no call, 5% скидки на инструментальные ошибки и так далее - всё выдумки. Я проводил сравнение результатов одного и того же человека, тестировавшегося в 23andMe и FTDNA. Совпадение оказалось около 99%. Из оставшегося процента с небольшим основную часть расхождений составляли no call (то есть результат по этому снипу не прошел тест на качество и его решили исключить). Неправильно прочитанные снипы, когда в двух компаниях результаты полностью расходятся, были буквально в единичных случаях.
Даже не надеюсь, что Михаил перестанет распространять фантазии, но по крайней мере, я вас предупредил  ;D

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Вы дали "сырые" данные в разных билдах генома человека. Напрямую, ес-но, они несравнимые:

http://forums.familytreedna.com/archive/index.php/t-38765.html
Цитировать
Each Build is a versions of human genome reference

As advancements in Science into the Human Genome are made, these references are adjusted

Each SNP has a reference position on our Genome, each build fine tunes so to speak their position.

For instance SNP rs3094315 in Build 36 Raw Data is given the position of 742429 on Chromosome 1, in build 37 it is given the position of 752566.

Пример по второй панели 23эндМи.
Памятуя Вашу склонность к преждевременной ... э-э-э, к скоропалительным НЕПРАВИЛЬНЫМ выводам, предлагаю посмотреть на следующую картинку.
Да, это не аутосомы, а игрек.
Да, совсем другая панель.
Но тип теста сходный.
Обратите внимание на количество прочитанного и непрочитанного:


Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Здесь два разных набора снипов. Первый тест это панель FTDNA, второй тест - 23andMe версия 3. Не удивлюсь, если и образцы разные.

Оба образца от разных персон, по одной (второй) панели из 23эндМи.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
я zip грузил - не ругался. Но матчей мало выдал: 13 и 7. Только самые близкие. Попробую для других китов txt отправить.

Я тоже грузил zip для своей сестры и все прошло без проблем. У нее появилось 29 матчей и все тоже самые близкие от 2nd-4th Cousin до 3rd-5th Cousin. Меня все устроило, есть только одна неточность. Одна совпаденка делала трансфер из 23andMe и там она была со степенью родства 3rd to Distant Cousin, а в FTDNA стала 2nd-4th Cousin. Я трансферта не делал, у меня оригинальный анализ FTDNA, но заметил такую тенденцию, что некоторые мои матчи, которые у меня идут как 3rd-5th Cousin, у сестры после трансферта появились уже как 2nd-4th Cousin.

Повторил попытку. Теперь успешно. Загрузились zip файлы. Причина фиаско в первый раз - входил в аккаунты из интефейса администратора, а нужно было из аккаунта пользователя.

Оффлайн gecube_ru

  • Сообщений: 1418
  • Страна: hu
  • Рейтинг +264/-6
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
То что yfull - это bigy, наверняка.
Bigy и familyfinder - это принципиально разные тесты. Технологически. Один - ngs, второй - чип (типа как geno2.0).
Странно, что Вы, Mich Glitch, этого не понимаете

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
То что yfull - это bigy, наверняка.
Bigy и familyfinder - это принципиально разные тесты. Технологически. Один - ngs, второй - чип (типа как geno2.0).
Странно, что Вы, Mich Glitch, этого не понимаете

О чём спор?
Ведь сделал все возможные оговорки.
Ведь не говорю, что ноу-коллы больше 40% (как по БигИгреку).
Ведь даже не смотрел 37 сборку ФТДНА и не рассматривал сколько там процентов ноу-коллов.

Мы говорим о трансфере данных из 23эндМи в ФТДНА.
Да, Вы новичок.
Да, у Вас совсем свеженькое там.
А у кого-то болтаются данный семилетней давности.
Разбираемся, почему не соответствуют данные 23эндМи и ФТДНА.

Причём разница не просто на уровне предиктов. Т.е. разных алгоритмах одних и тех же размеров максимальных УПСов и суммарного совпадения. А именно в разницах этих суммарных совпадений и этих максимальных УПСов.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.