АвторТема: A map of human genome variation: секвенированные фрагменты Y  (Прочитано 14975 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Михаил, у меня такое ощущение, что у Вас уже имеется некий целиком продуманный метод, который адекватен Вашим задачам. Которые только частично перекрываются с задачами, которые решает фазирование. Я не спорю, что иногда и на пальцах можно фазировать. И полусовпадения достоверной длины можно отличить без всякого фазирования. И географию можно выявлять только по генотипам. Но объясните, почему Вы Михаил против большего и лучшего? Вы считаете, что это не привнесет совсем ничего полезного? Если да, то почему?

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
И зачем нам знать точную вероятность какой-то отдельно взятой ничтожно вероятной цепочки?
Конкретный вопрос звучит так: какова вероятность того, что два человека со следующими гаплотипами (в нотации от 23эндМи)
AC; AG; AT ... AT; AT; AG
AT; AG; AG ... AC; AC; AT
имели общего предка?

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Михаил, у меня такое ощущение, что у Вас уже имеется некий целиком продуманный метод, который адекватен Вашим задачам.
Совершенно верно.
Метод этот положен в основу у 23эндМи, ДекодМи, ФТДНА (ФэмилиФайндер), УПСометра.

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Допустим у нас есть два человека с двумя корзинками, в каждой из которых лежат красные и зелёные яблоки.
Если мы знаем, что у каждого имеется по два зелёных яблока, то какова вероятность того, что каждый имеет по корзинке, в которой зелёные яблоки лежат вместе.

Этот пример самый простой.

Потом просто увеличиваем количество корзинок и цветов яблок. А потом от яблок переходим к значениям снипов.

Так Вы уже совсем близко подошли к фазированию, Михаил )

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Конкретный вопрос звучит так: какова вероятность того, что два человека со следующими гаплотипами (в нотации от 23эндМи)
AC; AG; AT ... AT; AT; AG
AT; AG; AG ... AC; AC; AT
имели общего предка?


без знания расстояния между снипами?



Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Но объясните, почему Вы Михаил против большего и лучшего? Вы считаете, что это не привнесет совсем ничего полезного? Если да, то почему?
Да, я и не против.
Я против противопоставления.
Типа, один метод прост и общепризнан, но туп.
А другой метод пусть пока не даёт никаких результатов (тему с биаллельным фазированием Вадим закрыл на полуслове);
пусть архисложен (часы ушли на одну только пару);
пусть не имеет внятно сформулированных целей;
но зато крут и за ним будущее, большее и лучшее.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Конкретный вопрос звучит так: какова вероятность того, что два человека со следующими гаплотипами (в нотации от 23эндМи)
AC; AG; AT ... AT; AT; AG
AT; AG; AG ... AC; AC; AT
имели общего предка?


без знания расстояния между снипами?

Нет со знаниями.

Тот же УПСометр разрабатывался сначала исходя из гомогенного распределаения снипов, а потом вносились (и вносятся) уточняющие поправки.

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Типа, один метод прост и общепризнан, но туп.


Михаил. я не понимаю задачи. Если участок не рекомбинирует ответ будет один а если все позиции нелинкованы то совсем другой. Они наверное решают это исходя из расстояния между снипами, какая-нибудь формула выведена.

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
но зато крут и за ним будущее, большее и лучшее.

Вот Вам пример: внутри некоторого гена лежит участок 50кб с рекомбинацией порядка ну 0.01 сМ, меньше средней для такого размера. Представьте что его растащили на снипы и работают с аллелями теми же методами как с мито и У! Это разве не заманчиво?

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Они наверное решают это исходя из расстояния между снипами, какая-нибудь формула выведена.
Как я себе это представляю, для разных, т.н. спорных участков хромосом используется система поправочных коээфициентов.
А формула, наверняка есть, учитывающая длину совпадающего участка, количество имеющихся на этом участке снипов, генетическую дистанцию и пр.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
но зато крут и за ним будущее, большее и лучшее.

Вот Вам пример: внутри некоторого гена лежит участок 50кб с рекомбинацией порядка ну 0.01 сМ, меньше средней для такого размера. Представьте что его растащили на снипы и работают с аллелями теми же методами как с мито и У! Это разве не заманчиво?
Это очень заманчиво.
Но говоря заманчиво, я остаюсь на позициях прикладной науки.
То есть для меня заманчиво детализировать степень родства по неполным данным.
Установить степень родства для трёх и более персон.
На основании уточнённых степеней родства реконструировать генеалогическое (не филогенетическое!) древо.

Что до каких-то задач фундаментальной науки, то уверен что в 99.9% всех случаев с наскоку и усилиями любителей-полупрофессионалов они не решаются.
Будучи конформистом, своего времени на это не трачу.
:)

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Здесь я не совсем понимаю логики. На входе мы имеем парную абракадабру, а на выходе - 2 реальных гаплотипа достаточно большой длины 400. Причем в регионах бедных на рекомбинацию это будут вполне нормальные такие аллели, с филогенией и происхождением, с возможностью выяснить географию. Чем это плохо? А уж выяснять от кого это пришло - ну для этого по любому надо иметь достаточный набор родственников с обеих сторон, иначе никак. Я бы без такого плотного набора тестируемой родни не брался бы за выяснение данного вопроса. Другое дело - это когда мы нашли совпаденца со всеми 400 или хотя бы с 100 позициями. Но для этого нужен более мощный чип хорошо покрывающий участки с малой рекомбинацией, то есть чип специально сдизайненный для генеалогии.

Читаю эту дискуссию и получаю несказанное удовольствие от комментариев действительно умного и сведущего человека. За что Валерию особая личная благодарность от меня.

Действительно, многие проблемы 23ия с предиктованием генеалогического родства обусловленны не несовершенством методов обработки данных, а скорее, недостатками модифицированного Иллюмина чипсета. Соврешенно ясно (даже при простом взгляде на геномный браузер HapMap) что плотность snp/kB (число снипов на килобазу) или snp/cM (снипов на сентиморган) далеко неодинакова в разных регионах генома и на разных сегментах хромосом. Далее, тот же проект ХапМап произвел достаточно надежное картирование хотспотов (горячих участков рекомбинации) для каждой из хромосом (и с каждой новой фазой проекта эта картирование становится все более точным).
Наличие хостпотов и неравномерная плотность выявленных снипов существенно затрудняет поиск устойчивых гаплоблоков (которые и опредляется в результате фазирования). А неравномерная плотность и что еще хуже отсутствие многих Хапмаповских снипов в чипсетах, используемых FTDNA и 23andme (кстати чипсет Decodeme - в отличие от чипсетов FTDNA и 23andme- наиболее близок к 1,5-млн чипсету HapMap) приводит к появлению искуственных УПС. Если не ошибаюсь, Леон, который занимался слияниям снипов FTDNA и 23ия, приводил примеры, когда после слияния данных УПСЫ (выявленные в отдельности по результатам снип-тестирования  FTDNA и в 23ия)  просто ломались, поскольку внутри участка который воспринимался, к примеру в 23ия, как непрерывная цепочка половинного совпадения (HIR-сегмент) вклинивался снип, нарушавший гармоничную последовательность.

А теперь представьте что будет с этими HIR-сегментам после того как будут протестированны миллион или полторамиллиона снипов? А что будет тогда, когда будет секвенсирован полный геном?

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Что до каких-то задач фундаментальной науки

Я бы это фундаментальной наукой не назвал. Истинные сМ могут с увеличением выборки смениться, точки рекомбинации постепенно выявятся и по сути дела все будет только чуток сложнее чем в однородительском случае.

Фундаментальная наука тут одна - это техника благодаря которой можно залезть туда куда не умели лазить раньше. Биология тут исключительно в роли статиста.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
чип специально сдизайненный для генеалогии.


Я даже позволю себе предположить (оговариваясь что не являюсь экспертом и не должен по идее высказывать таких общих предположений) - что некоторый упсопессимизм наметившийся в последний год в сообществе связан с тем что 23 и подобные конторы юзают массивы с малой плотностью снипов. Будь иначе - мы бы имели вполне нормальные гаплотипы, с филогениями и очень ограниченной рекомбинацией. И не было бы проблемы с достоверностью упсов - ибо совпадение 400 снипов не может быть случайным. Для этого нужно выбирать участки протяженностью порядка 10-100кб и заполнять их очень плотно.

Как я уже говорил, эти участки с ограниченной рекомбинацией также определены в том же проекте ХапМап. И, разумеется, генетики (медицинские и популяционные) уже определили и описали множество устойчивых гаплоблоков. В теме по X-хромосомным филогениям я уже приводил примеры таких блоков на X хромосоме.

Наличие таких гаплоблков позволяет с легкостью конструировать филогению (генеалогию) и географию этих сегментов.

И это только частный случай.

Оффлайн ValeryАвтор темы

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Биология тут исключительно в роли статиста.


Именно - можно тупо медитировать над картинкой из ста последовательных снипов разбиваемых рекомбинацией надвое раз в стока-то лет, начетверо - в столько-то и при этом наслаждаться четырьмя четверть-филогениями + двумя половинными + одной полной :)

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.