АвторТема: WGS vs [FamilyFinder|MH|others]  (Прочитано 1111 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн gecube_ruАвтор темы

  • Сообщений: 1436
  • Страна: hu
  • Рейтинг +268/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
WGS vs [FamilyFinder|MH|others]
« : 09 Сентябрь 2023, 20:23:52 »
Добрый день, уважаемое сообщество!

Я глядя на мульены совпаденцев шведов и финнов в своем фемили файндер начинаю тихоньку думать, что стандартный аутосомный тест дает слишком оптимистичную оценку степени родства двух произвольно взятых людей. Смотрите. Мы все знаем, что аутосомный тест по сути это специальный ДНК чип, проверяющий 700000 снипов на разных хромосомах. Получается условно 1.4 миллион значений, букв в различных локусах. Первая история, которая мне не нравится, что если условно два соседних SNP имеют общую пару значений у двух протестированных - значит, весь диапазон между ними тоже автоматически будет признан совпадающим. Правильно? Но ведь никакой гарантии, что ДНК между ними совпадает по сути нет! Для этого нужно делать WGS тестирование с хорошим разрешением, либо выбирать "координаты" таким специальным образом, чтобы между ними были какие-то значимые куски ДНК, которые у всех людей одинаковы, но это попросту невозможно!
Вторая история - что это аутосомное тестирование теряет информацию о том, какая из нитей была протестирована. И опять же получается, что мы можем получить фантомных совпаденцев (что и наблюдается на практике похоже?).

Таким образом у меня вопрос будет звучать так - если условный аутосомный тест показывает XX общей ДНК в % и сМ и общие одинаковые блоки (список блоков с координатами и длиной в % и сМ) между двумя произвольными людьми, то какие же метрики даст сравнение двух WGS тестов? Насколько большая погрешность будет именно у аутосомного теста? У меня есть подозрение, что в WGS количество общей ДНК будет определено точнее, а общие одинаковые блоки буду МЕЛЬЧЕ - их будет больше, но они будут каждый короче.
Что думаете?

И если это так - то не заявка ли это на создание нового, более дорого, но и более точного аутосомного теста на базе WGS?

И что тогда делать с конвертацией старых данных? Тем более, учитывая, что аутосомное тестирование было сделано уже на целой пачке разных чипов...

К сожалению, у меня пока проверить гипотезу не получается, так у меня попросту нет двух WGS из своих родственников.

Оффлайн wave48

  • Сообщений: 294
  • Страна: ru
  • Рейтинг +60/-9
  • Y-ДНК: N1c1-L550
  • мтДНК: U5b2a1a2
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #1 : 09 Сентябрь 2023, 20:52:16 »
Все не так.  Аутосомный тест выдаёт просто совпадения между участками в хромосомах. Откуда они взялись знает только Бог. Может двадцать лет назад, а может двадцать тысяч лет назад.

Оффлайн gecube_ruАвтор темы

  • Сообщений: 1436
  • Страна: hu
  • Рейтинг +268/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #2 : 09 Сентябрь 2023, 21:04:26 »
wave48
Я не про это спрашивал вообще-то, а про то, какую погрешность видит сообщество в результатах аутосомного теста. Потому что на самом деле, когда в аутосомном тесте пишут, что у вас совпадение, скажем, 100сМ - никто не проверяет каждый нуклеотид на этом диапазоне.

Это примерно как утверждать, что все овцы в Шотландии черные, потому что Вы видели 3 черные овцы :) и ни одной белой. Это отсылка к известному анекдоту про физика, математика в поезде.

Касательно того, откуда взялись нуклеотиды - ну, понятное дело, от мамы и папы :)

Оффлайн wave48

  • Сообщений: 294
  • Страна: ru
  • Рейтинг +60/-9
  • Y-ДНК: N1c1-L550
  • мтДНК: U5b2a1a2
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #3 : 09 Сентябрь 2023, 21:17:39 »
wave48
Я не про это спрашивал вообще-то, а про то, какую погрешность видит сообщество в результатах аутосомного теста. Потому что на самом деле, когда в аутосомном тесте пишут, что у вас совпадение, скажем, 100сМ - никто не проверяет каждый нуклеотид на этом диапазоне.

Это примерно как утверждать, что все овцы в Шотландии черные, потому что Вы видели 3 черные овцы :) и ни одной белой. Это отсылка к известному анекдоту про физика, математика в поезде.

Касательно того, откуда взялись нуклеотиды - ну, понятное дело, от мамы и папы :)
Что такое погрешность аутосомного теста?  Плюс мину с в сантиморганах пожалуйста. Я, как клхзиент тестировщиков такую инфу не имею. Хз что они проверяют, но я вдруг оказываюсь по мужской линии обыкновенным варягом...

Оффлайн NathanS

  • Сообщений: 1277
  • Страна: 00
  • Рейтинг +1202/-2
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #4 : 09 Сентябрь 2023, 21:20:52 »
Эта проблема меня беспокоит уже много лет. WGS все же является более универсальным решением на будущее, но до полного решения еще очень далеко.

Цитировать
Вторая история - что это аутосомное тестирование теряет информацию о том, какая из нитей была протестирована. И опять же получается, что мы можем получить фантомных совпаденцев (что и наблюдается на практике похоже?).

К сожалению, и WGS по методике NGS не дает информации о том, какая нить была протестирована. Уже третье поколение секвенирования дает фазированные данные, но стоимость там просто зашкаливает. HiFi reads от PacBio можно заказать в DanteLabs - покрытие около 3-4х за почти 2000 евро. YSEQ экспериментирует с Oxford Nanopore, но там тоже покрытие около 3х, да и продукта как такового нет, небирают группу интересующихся с ценой около 1300 евро. Chromium LongReads предлагала FGS, но за совершенно *********** деньги, почти 10 000 долларов.

 
Цитировать
И если это так - то не заявка ли это на создание нового, более дорого, но и более точного аутосомного теста на базе WGS?

Тут многое упирается в доступность WGS и способность обработать данные. Где полный геном за 100$? До него еще далеко, учитывая политические и шкономические факторы. Китайцы вроде сделали такой секвенатор (https://www.nsmedicaldevices.com/news/mgi-tech-rolls-out-ultra-high-throughput-sequencer/), но они его даже не продают, а сдают в аренду. Он может выдавать по 50 000 геномов в год, но до коммерческого применения полагаю еще далеко.

Обработка данных. Тут пока не ясно - ранее читал, что 10 миллионов снипов актуально для исследования происхождения, потом видел цифру в 30 миллионов, потом в 50 миллионов. Даже если взять 10 миллинов снипов - да, совпадения будут точнее и можно копать глубже, т.е. за пределами 5-8 поколений, но и степень достоверности совпадений будет ниже, а количество неопределяемых ветвей предков больше. Переход к 10 миллионам снипов будет почти 20 кратным увеличением количества данных, а ресурсы на обработку информации будут расти экспоненциально. Т.е. если взять базу с десятком миллионов результатов, а там по десятку миллиона снипов в каждом, то мы по полгода будет ждать результатов сравнения. Ну, вопрос по-своему решаемый, да и можно подождать с дальними совпаденцами.

Цитировать
И что тогда делать с конвертацией старых данных? Тем более, учитывая, что аутосомное тестирование было сделано уже на целой пачке разных чипов...

То решение, которое применяется сейчас - импутация данных. Уже переход на чип GSA меня сильно беспокоил - там со старым OmiExpress общих снипов 100-140  тысяч. Вот и появляются ложные совпаденцы. Старые данные будут иметь очень ограниченную применимость при переходе еще на один чип или на WGS. Я писал в FTDNA по поводу перехода на GSA и возможности применения других чипов с 2,5 или 5 миллионами снипов, но ответа не получил.

За WGS будущее - это коплексное решение и по аутосомам, и по Y, и по мито. А с аутосомами можно играться сколько душе угодно - выбирай любой подходящий набор и гоняй по любым калкуляторам, сравнениям и т.д. Для прорыва нужен WGS менее, чем за 100$.

Оффлайн gecube_ruАвтор темы

  • Сообщений: 1436
  • Страна: hu
  • Рейтинг +268/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #5 : 09 Сентябрь 2023, 21:40:08 »
NathanS
Цитировать
Вот и появляются ложные совпаденцы.
вот мне интересно и получить математическое, кхм, доказательство точности аутосомных тестов. Потому что для уровня до общего предка в 5-м поколении оно на практике доказано, что работает :-)
А вот для совпаденцев более дальних - там как будто погрешность уже ВЫШЕ, чем цифры из теста (но это мое личное ощущение)

Оффлайн gecube_ruАвтор темы

  • Сообщений: 1436
  • Страна: hu
  • Рейтинг +268/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #6 : 10 Сентябрь 2023, 09:38:09 »
wave48
Я думаю, что кусочки совпадения по 10сМ могут быть артефактами теста, то есть той самой погрешностью.

Оффлайн Srkz

  • Сообщений: 8502
  • Страна: ru
  • Рейтинг +4847/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #7 : 10 Сентябрь 2023, 10:37:58 »
вот мне интересно и получить математическое, кхм, доказательство точности аутосомных тестов. Потому что для уровня до общего предка в 5-м поколении оно на практике доказано, что работает :-)
А вот для совпаденцев более дальних - там как будто погрешность уже ВЫШЕ, чем цифры из теста (но это мое личное ощущение)
Так главная проблема же не в самих тестах, а в том, что в ДНК уже тупо нет достаточной информации для определения уровня родства. Ну измерим мы более точно длину общего сегмента с дальним совпаденцем - окажется, что он не 7.1 сМ, а 5.8 сМ. И что? Что поменялось?

upd Может, тут зайти с другой стороны - искать через WGS редкие общие снипы, как при построении игрек-дерева. Их носители будут вероятными родственниками. Но даст ли это возможность делать оценку возраста при небольшом или среднем количестве протестированных? А при очень большом можно будет уже построить сеть общего родства и по результатам тестирования на чипах. Так что тоже неоднозначное преимущество.
« Последнее редактирование: 10 Сентябрь 2023, 10:54:11 от Srkz »

Оффлайн gecube_ruАвтор темы

  • Сообщений: 1436
  • Страна: hu
  • Рейтинг +268/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #8 : 10 Сентябрь 2023, 11:04:40 »
Srkz
Мой тезис заключается в другом. То что на уровне обычного аутосомного теста видно как 25сМ непрерывный кусок, на уровне WGS может быть прерывистыми кусками по 5сМ, в общей сумме 20сМ. А тут получается, что аутосомный тест завышает степень родства. Прости, понятно объяснил? Мне самому сложно это сформулировать
Дальше интереснее. Действительно можно выделять семейные аутосомные SNP. Или при помощи WGS выделять общие «семейные» наборы SNP. То есть не только конкретный rsXXXXXX, но и его эпсилон окрестность, которая в силу статистических причин будет кочевать по семье в неизменном виде. То есть тот же подход, что и для популяционных маркеров, чтобы определить твою степень «неандертальскости»

Оффлайн Srkz

  • Сообщений: 8502
  • Страна: ru
  • Рейтинг +4847/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #9 : 10 Сентябрь 2023, 11:32:43 »
Мой тезис заключается в другом. То что на уровне обычного аутосомного теста видно как 25сМ непрерывный кусок, на уровне WGS может быть прерывистыми кусками по 5сМ, в общей сумме 20сМ. А тут получается, что аутосомный тест завышает степень родства. Прости, понятно объяснил? Мне самому сложно это сформулировать
Да, понятно. И это правильно, завышение длины сегментов однозначно есть. Но насколько вероятно, чтобы четыре куска по 5 сМ случайно оказались достаточно близко, чтобы сложиться вместе? Очень маловероятно, по-моему. Более вероятный вариант - когда пара кусков наложилась, один с одной хромосомы из пары, другой со второй. Ну тройка. Тут действительно бы очень помог сиквенс с разделением последовательностей. А ещё более вероятный вариант - к найденному реальному сегменту просто добавился на конце "фантомный" кусочек, и его длина оказалась завышена, в моём примере был именно такой случай.

И ведь если бы этот кусок 25 сМ на чипе состоял из нескольких снипов, но там же будут тысячи. То есть, мы нашли в Шотландии не трёх чёрных овец, а три тысячи. А ведь достаточно было затесаться между ними одной белой, чтобы помешать. Значит, если бы белые овцы в этом районе были, они бы проявились раньше. Но может быть, при более точном подсчёте бы выяснилось, что белые овцы начали попадаться уже в тот момент, когда мы перешли к 2500-й овце. Просто мы считали не всех подряд, а каждую двадцатую (обработали 60000 овец ;D), вот и пропустили нескольких белых.

Но я хотел обратить внимание на другое. Чем дальше родство, тем менее однозначно оно проявляется в ДНК. По подсчётам из одной статьи, уже от предка, жившего шесть поколений назад, человеку может с некоторой вероятностью не достаться ни единого участка. А это значит что? Измеряй, не измеряй, а по собственному тесту родство с другими его потомками не определишь вообще никак. Другой случай - вернёмся к варианту из первого абзаца, когда два кусочка с разных нитей сложились. Значит, у нас с этим человеком родство сразу по двум линиям. Почему же его надо отбрасывать? Но как определить, когда жили общие предки? По длине самих участков никак, у них могла быть совершенно разная судьба.

В общем, по тезису, что WGS будет определять общие сегменты точнее, у меня возражений нет, лишь некоторые дополнения. Мои сомнения относятся к идее, что это повышение точности заметно поможет с определением степени родства при совпадениях далее 3-4 поколений до общего предка.
« Последнее редактирование: 10 Сентябрь 2023, 11:47:39 от Srkz »

Оффлайн gecube_ruАвтор темы

  • Сообщений: 1436
  • Страна: hu
  • Рейтинг +268/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #10 : 10 Сентябрь 2023, 12:40:07 »
Вот я и хочу понять - насколько это поможет. Честно - в умных мужах из коммерческих компаний веры нет, так как им надо отбивать бабки, вложенные в стандартные геночипы для аутосом…

Srkz
Я еще добавлю, что у меня есть аутосомные результаты моей семьи, пока еще не обогащенные WGS. Поэтому определенная статистика есть, которой я мог бы поделиться.

Оффлайн Srkz

  • Сообщений: 8502
  • Страна: ru
  • Рейтинг +4847/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #11 : 10 Сентябрь 2023, 13:02:46 »
Я еще добавлю, что у меня есть аутосомные результаты моей семьи, пока еще не обогащенные WGS. Поэтому определенная статистика есть, которой я мог бы поделиться.
Да у меня есть много статистики чипы x чипы и чипы x WGS, особенно на популяционном уровне. Не сравнивал только WGS с WGS. Поэтому совершенно согласен, что есть такое явление, как завышение длины сегментов при снижении числа используемых снипов. Например, когда сравниваем между собой тесты на чипах разных серий, где пересечение небольшое.

Тут ещё важно, чтобы у WGS было хорошее покрытие, потому что иначе длина сегментов будет, наоборот, занижаться. Не беру тут расчёты MTA, у них какие-то собственные условные сегменты :)

Ну а насколько в точности поможет, не знаю. Просто из общих соображений радикального прорыва тут не жду.

Оффлайн gecube_ruАвтор темы

  • Сообщений: 1436
  • Страна: hu
  • Рейтинг +268/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #12 : 10 Сентябрь 2023, 14:08:12 »
Srkz
Хорошо. Ваши предложения? Я потенциально могу сделать WGS еще одному родственнику, все равно мне нужна его Y. Либо давай в телеграм или личку план тестирования обсуждать )

Оффлайн Srkz

  • Сообщений: 8502
  • Страна: ru
  • Рейтинг +4847/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #13 : 10 Сентябрь 2023, 14:31:35 »
Srkz
Хорошо. Ваши предложения? Я потенциально могу сделать WGS еще одному родственнику, все равно мне нужна его Y. Либо давай в телеграм или личку план тестирования обсуждать )
От меня никаких предложений, я в WGS не углубляюсь - слишком много вычислительных ресурсов требует :)

Оффлайн gecube_ruАвтор темы

  • Сообщений: 1436
  • Страна: hu
  • Рейтинг +268/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Re: WGS vs [FamilyFinder|MH|others]
« Ответ #14 : 18 Сентябрь 2023, 00:45:17 »
Ну, вот очередной результат с погрешностью, благо MH прекрасно показывает - есть ли среди родственников кто-то, кто матчится.



У родителей данной персоны нет никаких матчей. Так что весь этот 0.8% - сплошной фейк, но система уже радостно верещит, что это 4th cousin

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.