АвторТема: Создание усредненного набора для села  (Прочитано 2394 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Daemon2017Автор темы

  • Сообщений: 2456
  • Страна: ru
  • Рейтинг +1255/-18
  • Y-ДНК: R1a-Y35174
  • мтДНК: V7-a2a2a2b*
Привет, коллеги!

Есть 10 образцов коренных жителей 1 села - хочу создать из них синтетический усредненный набор и залить в Gedmatch, чтобы искать людей, которые могут быть связаны с селом. Возможно ли это и что для этого нужно сделать? Достаточно ли просто взять 10 CSV'шников и для каждой позиции выставить самое частое значение?

Оффлайн Srkz

  • Сообщений: 9186
  • Страна: ru
  • Рейтинг +5209/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Re: Создание усредненного набора для села
« Ответ #1 : 06 Февраль 2024, 20:26:35 »
Есть 10 образцов коренных жителей 1 села - хочу создать из них синтетический усредненный набор и залить в Gedmatch, чтобы искать людей, которые могут быть связаны с селом. Возможно ли это и что для этого нужно сделать? Достаточно ли просто взять 10 CSV'шников и для каждой позиции выставить самое частое значение?
Если речь о поиске общих сегментов, то оно так не должно работать ::) Лучше залить всех десятерых и потом обрабатывать статистику по их совпаденцам.

Оффлайн Daemon2017Автор темы

  • Сообщений: 2456
  • Страна: ru
  • Рейтинг +1255/-18
  • Y-ДНК: R1a-Y35174
  • мтДНК: V7-a2a2a2b*
Re: Создание усредненного набора для села
« Ответ #2 : 06 Февраль 2024, 20:41:09 »
Если речь о поиске общих сегментов, то оно так не должно работать ::) Лучше залить всех десятерых и потом обрабатывать статистику по их совпаденцам.

Да, о сегментах. Т.е. совсем никаких альтернатив нет - только поиск пересекающихся образцов?  Это ж ппц как потно. :-\

Оффлайн Srkz

  • Сообщений: 9186
  • Страна: ru
  • Рейтинг +5209/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Re: Создание усредненного набора для села
« Ответ #3 : 07 Февраль 2024, 09:30:51 »
Ну, попробовать вариант с самыми частыми значениями всё равно можно, вдруг что-нибудь да поймается. Только не так, что при 4 AA, 5 AC и 1 CC ставим AA, потому что A больше, а ставим AC ::)

Онлайн Farroukh

  • Maternal Y-DNA: R1b-FTD83033
  • ...
  • Сообщений: 18005
  • Страна: az
  • Рейтинг +6542/-17
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Re: Создание усредненного набора для села
« Ответ #4 : 07 Февраль 2024, 10:23:29 »
Попробуйте поступить по аналогии с игреками. В выборке с облаком из сонма разношёрстных родственников всегда можно найти двух наиболее удалённых друг от друга и третьего, который посерёдке. Выбирать по матрице взаимосовпадений с сортировкой по сМ - в любой выборке всегда найдутся соответствующие субъекты.

Оффлайн Daemon2017Автор темы

  • Сообщений: 2456
  • Страна: ru
  • Рейтинг +1255/-18
  • Y-ДНК: R1a-Y35174
  • мтДНК: V7-a2a2a2b*
Re: Создание усредненного набора для села
« Ответ #5 : 07 Февраль 2024, 12:39:58 »
Попробуйте поступить по аналогии с игреками. В выборке с облаком из сонма разношёрстных родственников всегда можно найти двух наиболее удалённых друг от друга и третьего, который посерёдке. Выбирать по матрице взаимосовпадений с сортировкой по сМ - в любой выборке всегда найдутся соответствующие субъекты.

Т.е. эдакая трилатерация, когда для одной пары селян берем списки совпаденцев и ищем общих, затем для второй пары селян берем и ищем общих, и т.д.?
Если образцов 2-3, то несложно, а для 10 уже потно( Вот был бы у GedMatch какой-нибудь API - можно было бы автоматизировать трилатерацию, но его нет  :D

Онлайн Farroukh

  • Maternal Y-DNA: R1b-FTD83033
  • ...
  • Сообщений: 18005
  • Страна: az
  • Рейтинг +6542/-17
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Re: Создание усредненного набора для села
« Ответ #6 : 07 Февраль 2024, 13:18:23 »
Матричный метод есть (FTDNA). Но если тесты не там, то тогда сложнее, увы

Оффлайн Древ

  • Сообщений: 842
  • Страна: ru
  • Рейтинг +231/-4
  • Y-ДНК: I-PH1410
  • мтДНК: H5a1a*
Re: Создание усредненного набора для села
« Ответ #7 : 08 Февраль 2024, 00:05:25 »
У МХ тоже есть матричный метод.

Оффлайн Daemon2017Автор темы

  • Сообщений: 2456
  • Страна: ru
  • Рейтинг +1255/-18
  • Y-ДНК: R1a-Y35174
  • мтДНК: V7-a2a2a2b*
Re: Создание усредненного набора для села
« Ответ #8 : 08 Февраль 2024, 00:08:09 »
Матричный метод есть (FTDNA). Но если тесты не там, то тогда сложнее, увы

У МХ тоже есть матричный метод.

Хм, ну да, это уже кое-что. Жаль, что в GM его убрали после отставки Хейварда(

Онлайн Farroukh

  • Maternal Y-DNA: R1b-FTD83033
  • ...
  • Сообщений: 18005
  • Страна: az
  • Рейтинг +6542/-17
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Re: Создание усредненного набора для села
« Ответ #9 : 08 Февраль 2024, 10:50:27 »
Конечно, лучше всего было бы иметь под рукой софтину, которая помещала бы всю группу на аутосомный плот и сама находила бы крайние образцы и срединного носителя.

Можно сваять синтетический аутосомный портрет среднего субъекта из выборки, и даже снабдить его доминирующими игреком и митой. Понятное дело, тут тоже нужен подручный софт для вылепливания фантомного кариотипа. Но и без софта понятны недостатки этого пути, весьма напоминающие попытки ориентироваться на модальный гаплотип при игрек-поиске.
« Последнее редактирование: 08 Февраль 2024, 13:26:39 от Farroukh »

Оффлайн Daemon2017Автор темы

  • Сообщений: 2456
  • Страна: ru
  • Рейтинг +1255/-18
  • Y-ДНК: R1a-Y35174
  • мтДНК: V7-a2a2a2b*
Re: Создание усредненного набора для села
« Ответ #10 : 08 Февраль 2024, 12:35:12 »
Конечно, лучше всего было бы иметь под рукой софтину, которая помещала бы всю группу на аутосомный плот и сама находила бы крайние образцы и срединного носителя.

Можно сваять синтетический аутосомный портрет среднего субъекта из выборки, и даже снабдить его доминирующими игрепом и митой. Понятное дело, тут тоже нужен подручный софт для вылепливания фантомного кариотипа. Но и без софта понятны недостатки этого пути, весьма напоминающие попытки ориентироваться на модальный гаплотип при игрек-поиске.

100%! Но API от GW хрен дождешься :\

Вот ПО для создания усредненного синтета, наверно, я осилю ;D

Оффлайн Srkz

  • Сообщений: 9186
  • Страна: ru
  • Рейтинг +5209/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Re: Создание усредненного набора для села
« Ответ #11 : 08 Февраль 2024, 13:30:30 »
Тут нужен не столько срединный носитель, сколько отбор каких-то уникальных именно для данной деревни вариантов. Отличающих её жителей от остальных.
То, что их объединяет, может ведь заодно объединять и с сотней миллионов других людей :)

Оффлайн Daemon2017Автор темы

  • Сообщений: 2456
  • Страна: ru
  • Рейтинг +1255/-18
  • Y-ДНК: R1a-Y35174
  • мтДНК: V7-a2a2a2b*
Re: Создание усредненного набора для села
« Ответ #12 : 08 Февраль 2024, 14:04:45 »
Тут нужен не столько срединный носитель, сколько отбор каких-то уникальных именно для данной деревни вариантов. Отличающих её жителей от остальных.
Справедливо! Но это надо иметь доступ к целой базе аутосомных гаплотипов, чтобы найти уникальные последовательности. Точно не потяну(

То, что их объединяет, может ведь заодно объединять и с сотней миллионов других людей :)
Это да, но хоть что-то. Возможно, что отделения 1к образцов, близких всему селу, от 1кк образцов, близких некоторым селянам, будет достаточно :)

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.