АвторТема: FTDNA начала принимать более новые файлы 23andme и AncestryDNA  (Прочитано 17949 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
А теперь про 22%.
Вспомнил!
У меня в голове часто застревают цифры, но в памяти теряется их источник.
Данная цифирь ползёт из тех времён, когда создавали сайт HIRsearch. Ровесник, если не предтеча ГедМатч.
Можно в теме форума посмотреть, какие там панели сранивались и какой точно процент ноу-коллов был.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Кстати, по 37 сборке можно сделать архичистый эксперимент.
Посмотреть, какой процент ноу-коллов там. Да, возможно речь идёт о единицах процентов.

Проверить это очень просто. Посчитать количество ноу-коллов для образцов, взятых у одного и того же человека с интервалом в один час.

Всем кто хочет повозиться - могу закинуть данные.

Сейчас сам, быстренько посчитаю на коленке.

:)

Оффлайн gecube_ru

  • Сообщений: 1441
  • Страна: hu
  • Рейтинг +268/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Цитировать
Всем кто хочет повозиться - могу закинуть данные.
закидывайте. Почта есть.

Оффлайн gecube_ru

  • Сообщений: 1441
  • Страна: hu
  • Рейтинг +268/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Mich Glitch
Mich Glitch
А можно попросить Вас сравнить эти два FF от одной персоны? Интересно, если из них собрать один кит с меньшим кол-вом ноу коллов, это поможет делу? Интересен вопрос цена/качество. А то реально придется ждать дешевого WGS такими темпами...
Проблема в том, что Вы проигнорировали это мое сообщение. И я в здравой памяти и крепком здравии  ;D думал, что Вы привели пример FF от одной персоны с интервалом час. И вообще непонятно, что Вы так болезненно реагируете на критику  ;D ;D ;D ;D К тому же FF - это только FTDNA, у 23andMe тест в принципе тот же, только немного другой набор SNP, и будем называть его по-другому, чтобы не путать.

На самом деле вопрос конвертации ОЧЕНЬ интересен и актуален. Но его надо решать по-другому. Нужно привести все данные к единому виду (один билд, один формат) и сравнить.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
На коленке не выходит. Не могу найти опцию для подсчёта --.     :(

Кстати, остаются сомнения по поводу того, чем является -- в выходном файле 37 сборки. Ноу-коллом, или же позицией отсутствующего значения.
Трактую её как ноу-колл.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
И вообще непонятно, что Вы так болезненно реагируете на критику  ;D ;D ;D ;D

Болезненно?
Реагирую?!    :o
Честно сказать, на Вас я вообще никак не реагирую.

Уже знаю, что разговоры с определённым типом людей - пустая трата времени.

Оффлайн Srkz

  • Сообщений: 8539
  • Страна: ru
  • Рейтинг +4876/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
В файле 23andMe примерно 2010 года (вторая панель) доля снипов со значением "--" составила 0,72%

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Уже вижу перед своим носом, что количество -- в 37 сборке никак не тянет на 1/5, а составляет единицы, если не доли процентов.

Сейчас посмотрю по одной и той же позиции в двух разных файлах идёт ли речь о ноу-колле, или же об отсутствии данных в геноме.

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
В файле 23andMe примерно 2010 года (вторая панель) доля снипов со значением "--" составила 0,72%

Похоже, что -- соответствует именно отсутствующей позиции, а не ноу-коллу.

Обосновываю двумя файлами 37 сборки:




Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Когда мудрили с HIRopractor, так он назывался, сравнивали два файла от двух людей (иначе не получалось). И утилитой выводили разнящиеся значения, исключая сочетания типа --, АА, АС, ТТ и т.д.
Короче говоря, проверяли позиции.
Или же проверяли позиции с исходником панели.

Ноу-коллы, кажется, высвечивались в файле статистики.

Собственно, меня интересует вопрос не типа кто умный, а кто дурак, как наивно предположил gecube_ru. А именно конкретные цифры.    :)

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Посмотрите на размеры зазипованных файлов:




Что до количества ноу-коллов, то логичнее найти родную спецификацию и ссылаться на неё.
Если кто-то выложит - будет очень хорошо.
А так не понятно, кто считал, что считал и как считал.    :)

Оффлайн gecube_ru

  • Сообщений: 1441
  • Страна: hu
  • Рейтинг +268/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Итак, сравнил два набора данных - b36 и b37 для одного кита сконвертированного в  FT-DNA. Отличие только в том, что в b36 есть rs11089263 в позиции 15467656 на chr22.
В остальном - набор SNP полностью идентичен, за исключением позиции (она нас в принципе пока не очень волнует).

Далее. Файл исходный (23andMe) - 596868 SNP согласно b37 (видно по позициям в файле). Сконвертированный в FTDNA путем аутосомного переноса - 312393 (или 312392 SNP - для b37), т.е. чуть более половины. А вы там что-то про ноу-коллы рассказываете...

А теперь я беру, свой, родной файл FF (FTDNA) b36 - 702457 строчек SNP; в b37 - 702442. И похоже, что из них ~15391 no-call (т.е. "--" в исходном файле b37)

Следующий этап - хочу сравнить два родных кита FF. Желательно для одной и той же персоны. Очень жду "сырых" данных от Mich Glitch
« Последнее редактирование: 19 Февраль 2017, 20:44:08 от gecube_ru »

Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Вернусь к тому, что -- не обязательно обозначает ноу-колл. Оно может соответствовать отсутствующим значениям (и скорее всего соответствует).
В качестве примера приведу данные отца. Надеюсь никто всполошно не будет вскидывать руки и говорить, что не ожидал от меня непонимания разницы между мито и аутосомами.   :)
Просто мито - наиточнейший из возможных тест (опуская сравнение с CODIS аутосомными СТРами).


Оффлайн Mich Glitch

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Идём дальше.
Если полагать зипун по 277812, размером в 7448 КБ за 100%, то 6200 КБ по 277811 составят 83%.
Да, надо смотреть размеры выходных файлов. Сравнивать их. И т.д. И т.п.
Но, повторюсь, лучше сравнить со спецификацией.

Оффлайн gecube_ru

  • Сообщений: 1441
  • Страна: hu
  • Рейтинг +268/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
С мито вообще темный лес, т.к. в "сыром файле" от 23andMe есть такое

Цитировать
i3002604   MT   14212   T
i5049848   MT   14212   --
и как это понимать ?  ???

Кстати, "--" в аутосомном тесте на GEDMATCH 100% диагностируется как no-call

Цитировать
Если полагать зипун по 277812, размером в 7448 КБ за 100%, то 6200 КБ по 277811 составят 83%.
зипуны лучше не сравнивать. Если есть эксель или либреофис - лучше сравнивать кол-во строчек, соответствующих исследуемому вопросу (аутосомы, Y или мито).

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.