АвторТема: Фазирование данных 23иЯ и FTDNA  (Прочитано 32555 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6333
  • Страна: ru
  • Рейтинг +1337/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Фазирование данных 23иЯ и FTDNA
« : 09 Март 2012, 15:44:52 »
Вот сама утилита (инструкция внутри)
http://www.exploredna.com/files/GenComp1.1.zip

Что делать, если указанная утилита не работает под Windows7? Файлы с данными были размещены в той же директории, но далее результата не было.
А утилиты Пайка предполагают похромосомную обработку данных и копирование выходные данные в  файл прямо с экрана. У меня нет уверенности, что получится нечто, что можно скормить в новую утилиту GEDmatch....

О преимуществах фазирования можно прочесть здесь и выше в той же теме.
« Последнее редактирование: 05 Май 2012, 23:15:36 от Шад »

Оффлайн UA6ATG

  • Сообщений: 181
  • Страна: ru
  • Рейтинг +31/-1
  • Y-ДНК: J-M172
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #1 : 10 Март 2012, 12:06:37 »
Да, но было бы неплохо сначала понять зачем это надо.  Простым человеческим языком так никто и не объяснил.

Оффлайн I2a1a

  • ...
  • Сообщений: 10363
  • Страна: ee
  • Рейтинг +761/-8
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #2 : 10 Март 2012, 19:07:53 »
Да, но было бы неплохо сначала понять зачем это надо.  Простым человеческим языком так никто и не объяснил.

Простым человеческим языком это и не объяснить.

Вы же не просите объяснить простым языком принцип термоядерной реакции.

Буду краток -фазирование может быть полезно для генеалогии.

Оффлайн I2a1a

  • ...
  • Сообщений: 10363
  • Страна: ee
  • Рейтинг +761/-8
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #3 : 10 Март 2012, 19:11:13 »
Как говорит Диенек - больше Вам и не нужно знать ;D

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6333
  • Страна: ru
  • Рейтинг +1337/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #4 : 28 Март 2012, 23:33:34 »
Да, но было бы неплохо сначала понять зачем это надо.  Простым человеческим языком так никто и не объяснил.

Смысл в следующем.
В результате фазирования выдеяются сегменты ДНК, присутствующие у всех близких родственников, имеющих общего предка. Т.е. проанализировав данные по двоюродным и/или троюродным братьям/сестрам, можно выявить блоки, характерные для их общих деда/бабушки или прадеда/прабабушки. В результате можно четко проследить - со стороны какого из родителей "пришли" в геном конкретные сегменты, осеять ложные УПСы (с другими родственниками тогда совпадений не будет), выявить (в перспективе) стабильные блоки, характерные для жителей определенной местности, определенной группы населения.

Оффлайн kbg

  • Сообщений: 752
  • Страна: ua
  • Рейтинг +109/-0
  • Днипро
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #5 : 29 Март 2012, 18:34:05 »
У меня на 23эндМи есть следующие тесты:
я
мама
двоюродный брат со стороны мамы
тетка по отцу

Мне это может быть полезно?

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6333
  • Страна: ru
  • Рейтинг +1337/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #6 : 29 Март 2012, 21:04:46 »
У меня на 23эндМи есть следующие тесты:
я
мама
двоюродный брат со стороны мамы
тетка по отцу

Мне это может быть полезно?

В моем понимании - да. К сожалению сам этой неолитической технологией пока не овладел:)

Оффлайн kbg

  • Сообщений: 752
  • Страна: ua
  • Рейтинг +109/-0
  • Днипро
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #7 : 31 Март 2012, 13:15:59 »
Вадим,
не могли бы Вы как главный фазировщик объяснить для филолога,
1. зачем это мне может быть полезно (или в принципе при удовлетворении каких минимальных условий это может быть интересно для генеалогии)
2. как это сделать

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6333
  • Страна: ru
  • Рейтинг +1337/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #8 : 19 Апрель 2012, 01:39:54 »
Да, но было бы неплохо сначала понять зачем это надо.  Простым человеческим языком так никто и не объяснил.

Простым человеческим языком это и не объяснить.

Вы же не просите объяснить простым языком принцип термоядерной реакции.

Буду краток -фазирование может быть полезно для генеалогии.

Фазирование "работает" по приципу этно-популяционного анализа? Формируется набор снипов, характерный для конкретной популяции, в данном случае - семьи?

Оффлайн Eugen Hartmann

  • Сообщений: 269
  • Страна: zw
  • Рейтинг +6/-1
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #9 : 19 Апрель 2012, 12:03:13 »
Дампы снипов, которые выдаёт FTDNA и 23andme не фазированы. Т.е., например в первой строке левый столбец от отца, а например во второй строке левый столбец от матери, от отца правый. Это вносит погрешность при определении родства с другими людьми и просчитывании этнической принадлежность, потому что приходится все варианты расположения учитывать. Фазирование позволяет избежать (или частично избежать? не хочу домысливать) погрешностей. Как-то так.

Оффлайн Kartveli

  • Сообщений: 525
  • Страна: ge
  • Рейтинг +155/-0
    • Georgian DNA Project
  • Y-ДНК: J-BY70
  • мтДНК: D4c2b
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #10 : 07 Июнь 2012, 17:20:30 »
Новая утилита на Gedmatch - Phased data generator

http://ww2.gedmatch.com:8006/autosomal/phase1.php
« Последнее редактирование: 07 Июнь 2012, 20:44:02 от Шад »

Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6333
  • Страна: ru
  • Рейтинг +1337/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #11 : 07 Июнь 2012, 20:43:23 »
Полезные пояснения по работе утилиты от Вадима:

Цитировать
Благодаря усилием неутомимого Джона Олсона, инвентарь Gedmatch.com пополнился утилитой, которая определяет гаплоидную фазу аутосомных генотипов. Наилучшие результаты эта утилита дает при классическом фазировании трио: мать, отец, ребенка. Однако, по определенным причинам, не у всех клиентов FTDNA или 23andme есть данные генотипов своих родителей. Поэтому Phasing Utility на Gedmatch.com может фазировать генотипы исходя только из данных ОДНОГО из родителей и ребенка.

Загружать можно только данные трио. Попытка загрузить данные людей, находящихся в другой степени родства вызовет ошибку обработки. Возможность фазировать данные по дядям/тетям, дедушкам/бабушкам пока в он-лайн утилите не реализована. Хотя при этом точность фазирования вырастает на порядок.

Фазированные данные автоматически сохраняются на сервере GEDmatch.  Для ребенка с номером 'xxxx', файл с данными, фазированными по отцу, будет называться PxxxxP1, а по матери - PxxxxM1.

Цитировать
После того, как будет готов режим сравнения генотипов cо всей базой данных число false-positive "cовпадений" должно сократится.

Вопрос:
А если трое детей? Фазирование даст по три набора данных на каждого родителя. Как их применять и интепретировать при поиске? Или достаточно фазировать себя и супругу по одному из детей?

Ответ:
Цитировать
Нет. Фазирование геномных данных Ваших троих детей даст ТРИ РАЗНЫХ набора "половинок", одна из которых будет отображать генотипы, унаследованные КАЖДЫМ из Ваших ТРОИХ детей от Вас, а вторая - соответственно генотипы, унаследованные КАЖДЫМ из Ваших ТРОИХ детей от Вашей жены. Совершенно ясно, что эти 3 набора гаплоидных фаз не будут идентичны между собой. КАЖДЫЙ из трех наборов будет являть собой отдельную проекцию генома Вашего ребенка на Ваш геном и геном Вашей супруги



Оффлайн ШадАвтор темы

  • Главный модератор
  • *****
  • Сообщений: 6333
  • Страна: ru
  • Рейтинг +1337/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #12 : 07 Июнь 2012, 20:45:08 »
Пояснение по формату фазированных данных.
Цитировать
Detail for file format for phased and partially phased data

Each line in the file consists of either a comment or data
Any line that starts with a # is considered a comment and is ignored
Data lines are always four fields
They may or may not be quoted
and the fields can be seperated by comma, one tab or one space
Upper-case and Lower-case have no significance to the program, and
may be used as a convenient way to flag phase / unphased data.
The '!' symbol indicates a 'hard break' between data segments.
(see example below)

File names must be of the form: <Kit #><M | P>-autosomal-o-results.txt
the file names can end in .csv, .txt with optional .gz for compressed
files(preffered)
The file can be missing one or more sets of chromosome data and but any
chromosome that is included should have all the rs SNPs of the
unphased file.

Example data file 4354P-autosomal-o-resutls.txt
=============
# RSID,Chr Position SNP
# Merging Program output to file C:/Users/John/Documents/PHASING/JSW-OE(Phase1).txt
# Input
# C:/Users/John/Documents/PHASING/JSW-OE(P2).txt
# C:/Users/John/Documents/PHASING/JSW-SGW.txt
rs3094315   1   742429   A
rs3131972   1   742584   G
rs12562034   1   758311   G
rs12124819   1   766409   --
rs11240777   1   788822   G
rs6681049   1   789870   C
rs4970383   1   828418   cg
rs4475691   1   836671   C
rs7537756   1   844113   A
rs13302982   1   851671   G
rs1110052   1   863421   T
rs2272756   1   871896   ag
rs17160698   1   877025   T
rs3748597   1   878522   C
rs13303106   1   881808   G
rs28415373   1   883844   C
rs13303010   1   884436   A
rs6696281   1   892967   C
rs28391282   1   894028   G
rs2340592   1   900798   G
rs13303118   1   908247   ag
rs2341354   1   908436   ag
rs6665000   1   914761   A
rs2341362   1   917172   C
rs9777703   1   918699   T
# start of segment of unphased data
#
rs1891910   1   922320   !
rs9697457   1   924208   !
rs35940137   1   930066   !G
rs3128117   1   934427   !
rs2465126   1   936897   !
rs2341365   1   938555   !
rs15842   1   938784   !
rs6657048   1   947503   !
rs2710888   1   949705   !
rs3128126   1   952073   !
rs2710875   1   967643   !
rs2465136   1   980280   !
rs2488991   1   984254   !
rs7526076   1   988258   !
rs3766192   1   1007060   !
rs3766191   1   1007450   !
# end of segment of unphased data
rs9442372   1   1008567   gg
rs10907177   1   1011209   A
rs3737728   1   1011278   gg
rs10907178   1   1011446   A
rs9442398   1   1011558   ag
rs9442400   1   1015164   C
rs4074137   1   1016570   aa
rs6687776   1   1020428   C
rs11579015   1   1026822   T
rs6671356   1   1029889   T
rs7548798   1   1050037   C
rs7540009   1   1050098   G

Оффлайн kaa76

  • Сообщений: 632
  • Страна: ru
  • Рейтинг +215/-0
  • Y-ДНК: R-L1029
  • мтДНК: U5a2a2
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #13 : 07 Июнь 2012, 23:08:30 »
Уважаемый Шад, выкладывайте всё на нашу Вики в виде инструкции, чтобы интересующиеся могли ознакомиться ;)

Оффлайн Anode

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Re: Фазирование данных 23иЯ и FTDNA
« Ответ #14 : 08 Июнь 2012, 07:26:55 »
Загружать можно только данные трио. Попытка загрузить данные людей, находящихся в другой степени родства вызовет ошибку обработки.

Не только трио. Можно загрузить и одного родителя (с ребёнком) и получить генотип другого родителя.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.