АвторТема: Воссоздание ДНК умершего предка на базе аутосомальных тестов его потомков.  (Прочитано 2564 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн burstenАвтор темы

  • Сообщений: 8
  • Страна: de
  • Рейтинг +3/-0
  • Потомок казаков Харченко
  • Y-ДНК: R-Y55469
Коллеги, у меня стоит задача найти место исхода на Кубань из Украины моего прадеда: Харченко Пантелей Трофимович, 1908 гр.
В условиях нулевой сохранности как метрик, так и записей ЗАГС в месте его проживания на Кубани с 1922 по 1965 год - ДНК генеалогия остается единственным путем для выхода на родовое гнездо.

Имея на руках нижеуказанный объем данных, задумал исследовать возможность создания искусственно скомбинированного нового набора данных аутосомальной ДНК, который будет содержать максимальное количество данных, относящихся именно к искомому человеку.
Наличие такого набора данных на руках, подгруженного в базы данных MyHeritage, GedMatch, etc - позволит выявить совпаденцев с максимально длинными общими цепочками ДНК = ближайших к прадеду потомков родственников из места, где он родился.

Что мы имеем на сегодняшний день?
  • BIG Y - тест по линии Харченко, гаплогруппа R-Y55469
  • Два аутосомальных теста внуков Харченко П. Т. по разным детям - Вера 1930, Алексей 1928 (обведены синим на фрагменте древа)
  • Два аутосомальных теста внуков Троян А.Г. по разным детям - Александр 1915, Нина 1931 (обведены фиолетовым на фрагменте древа) - сделанные с целью отсекать ДНК совпаденцев по ветке Троян-Нелины для проведения исследований по месту исхода/рождения Харченко П.Т.
  • Все тесты подгружены во все значимые базы данных ДНК (за исключением 23andMe)[/b]
  • За два года работы не обнаружено совпаденцев с длиной общей цепочки ДНК более 30 см, что мы можем отнести к родственникам Харченко П.Т.[/b]


Способ предполагаемого построения искуственного набора данных ДНК:

1. Взять аутосомальные анализы ДНК у 3 из 5 живых внуков Харченко П.Т., чтоб получить по набору ДНК от внука каждого из 5 детей прадеда.
2. Разместить их в базах данных MyHeritage, после чего:
    - выделить в совпаденцах ДНК для этих внуков тех персоналий, кто имеют общие участки ДНК сразу с одним и более других внуков одновременно.
    - удалим из выборки тех совпаденцев, у кого места проживания относятся к Кубани, а не Украине и имеют большое число совпаденцев там.
      С очень высокой долей вероятности это родственники жены Харченко П.Т., Стасюк Елизаветы Михайловны 1906, коренной казачке с Кубани, а не его.
    - триангулированные участки совпадающих ДНК - поместить в пространство данных новой искуственной ДНК
    - участки ДНК от 6 см длиной, совпадающие у совпаденца с одним из внуков, но не совпадающие у другого для выделенной группы совпаденцев - также помещаем в пространство создаваемой искуственной ДНК.

На этом этапе у нас получится ДНК с подгруженными участками, относящимися только к Харченко П.Т., но с пустыми участками (см визуальный пример такой ДНК на фото из DNA Painter).


После этого переходим к шагам 3 и 4:
3. Заполняем пустые участки данными аутосомальных ДНК от внуков Харченко П.Г., исключая участки, которые относятся к ДНК родителю не по линии их деда Харченко П.Т.
4. Подгружаем получившийся искусственный образец raw data аутосомальной ДНК в базы базы данных MH, Генотек, GedMatch.
5. Внимательно изучаем родословную/места проживания предков - совпаденцев с этим ДНК профилем, имеющими 50+ см общей ДНК.
В случае успеха - выходим на точное место рождения моего деда.

[!] Готов выслушать Вашу критику такой модели выхода на результат.

[?] Позволю спросить Вас, знаете ли вы инструмент или специалиста, компанию, с помощью которых можно было бы синтезировать описанный искусственный ДНК профиль прадеда на основе данных из аутосомальных тестов его потомков


Оффлайн Georg

  • Сообщений: 1105
  • Страна: ru
  • Рейтинг +359/-8
  • Племянник vk511(Y),vk160(аДНК)
  • Y-ДНК: I1a1b1a1e2 (Y353312)
  • мтДНК: Я U5b2a1b, дети T1a1ct и H5b*
как вам фиктивный набор поможет найти дополнительных родственников по нужной линии? никак. фазируйте и кластеризуйте.

какой-то сайт (не очень популярный) делал одного из родителей по имеющемуся ребенку и 1 супругу, но по внукам придется писать самому)

вообще со временем все больше будет подобных запросов, но шансы найти не изменятся.

никто таким не заморачивается, я то ответил потому что проблема схожая.
лучше молитесь и ждите близкого Y. Может лет через 30 всех побигуют

Оффлайн burstenАвтор темы

  • Сообщений: 8
  • Страна: de
  • Рейтинг +3/-0
  • Потомок казаков Харченко
  • Y-ДНК: R-Y55469
какой-то сайт (не очень популярный) делал одного из родителей по имеющемуся ребенку и 1 супругу, но по внукам придется писать самому)

Вот он: https://borlandgenetics.com

как вам фиктивный набор поможет найти дополнительных родственников по нужной линии? никак.
Он увеличит эффективность моей работы по анализу совпаденцев в разы, если не на порядки.
Я буду в отличие от сегодняшнего дня:
1) Видеть ТОЛЬКО совпаденцев по целевой персоне (прадед)
2) Вступая в коммуникацию с совпаденцами, я буду из списка ТОП близких родственников с общей ДНК более 50, или даже 100 сентиморгена, а не несчастные 15-25 см в конце списка.
Это обозначает бОльшее внимание к моим вопросам о происхождении.

Новых сегментов ДНК не появится, такой задачи и не стоит.
Если б стояла - сделали бы эксгумацию тела и забор биоматериала с благословления родителей.
Задача - кратно улучшить эффективность процесса.

фазируйте и кластеризуйте.
В какой программе? Что бы вы посоветовали?

вообще со временем все больше будет подобных запросов, но шансы найти не изменятся.
Если спрос будет платежеспособный, будет и инструмент, нет сомнений.

лучше молитесь и ждите близкого Y. Может лет через 30 всех побигуют
Зная свой характер - это не мой путь.
Везет тем, кто сам везет.
Я лучше оплачу BIG Y тем, кто со мной по Y30 совпадает  ;)
Время - высшая ценность в моем мире.

Оффлайн AleksG

  • Maternal Y-DNA: R-L365->R-Y596405
  • Сообщений: 1574
  • Страна: 00
  • Рейтинг +673/-6
  • Y-ДНК: Q-PH2513
  • мтДНК: U5a1a1a5
Извиняюсь за оффтоп, но я почитал ваш топик на vgd про поиск Харченко. Вижу вы проделали гигантскую работу и, вероятно, перепроверили уже все и вся.

Но тем не менее спрошу - смотрели ли вы детально Белоцерковку, Александровского уезда, Екатеринославской губернии ?
Это я к чему, в 1908 году в тамошней МК есть один (единственный) Пантелеймон, при этом еще и Трофимович. Не Харченко, правда, а Лисовский
https://www.familysearch.org/ark:/61903/1:1:6XC8-PLRB?lang=en
но видно что эти Лисовские с хутора Ланцова, Таврической губернии

и в той же МК Белоцерковки еще есть и другие жители Ланцова, но что самое интересное - среди них есть и Харченко
https://www.familysearch.org/ark:/61903/1:1:6XC8-LTH6?lang=en

В общем, мало ли ...

Оффлайн Farroukh

  • Maternal Y-DNA: R1b-FTD83033
  • ...
  • Сообщений: 18926
  • Страна: az
  • Рейтинг +7097/-18
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Цитировать
создания искусственно скомбинированного нового набора данных аутосомальной ДНК, который будет содержать максимальное количество данных, относящихся именно к искомому человеку.
Доброго дня! Подобные идеи по созданию синтетического аутосомного профиля на нашем форуме уже озвучивались.

Теоретически, мысль здравая и практически реализуемая. Какова будет её реальная эффективность ? Да, Вы отсеете сторонних совпаденцев от супружеских адмиксов.  Но кого Вы увидите в лучшем случае?

Максимальный ожидаемый объём - результат условного патернального праправнука Трофима Харченко из документально неизвестной линии. Этот человек будет иметь тот же Y и порядка 70 сМ с синтетическим профилем Трофима.

Ваш терминальный уровень - R-Y55469 - является нисходящим от R-L1029. Тест Family Finder определяет Ваш уровень как L1029 у тех, кто тестировался ~5 лет назад и как Y416 - у тех, кто протестирован за последние пару-тройку лет.

Поищите среди аутосомных совпадений ~20+ сМ носителей R-L1029 и R-Y416. Свяжитесь с каждым из них на предмет их поднятия до BigY, сразу обозначив, что готовы оплатить апгрейд вместо них, заодно узнайте, что они сами знают о своих прадедах. Что-то Вы точно выясните.

Оффлайн Val_Metov

  • Сообщений: 1307
  • Страна: ru
  • Рейтинг +1003/-2
  • Y-ДНК: J-Y94477
Реконструкция аутосомного ДНК умершего предка возможна и основана на принципах генетического наследования и использовании вычислительных методов. Цель состоит в том, чтобы собрать сегменты ДНК предка, которые были унаследованы его потомками.

**Теоретическая основа**

Каждый потомок (например, внук) наследует примерно 25% ДНК от каждого из своих бабушек/дедушек, но конкретные унаследованные сегменты различаются у разных потомков. Путем тестирования достаточного количества потомков, можно собрать воедино значительную часть аутосомного генома предка, перекрывая унаследованные ими сегменты.

**Методология реконструкции**

Процесс реконструкции включает несколько ключевых этапов:

1.  **Сбор данных аутосомных тестов**
    *   Необходимо протестировать максимально возможное количество ближайших родственников предка.
    *   Особо ценным является тестирование внуков, особенно тех, кто происходит от разных детей предка, поскольку это увеличивает вероятность охвата различных сегментов ДНК предка.
    *   Тестирование других родственников (например, супругов детей предка) также может быть полезным для исключения сегментов ДНК, унаследованных не от целевого предка.

2.  **Фазирование данных**
    *   Этот шаг подразумевает разделение генотипов каждого протестированного потомка на материнские и отцовские гаплотипы.
    *   Для этого используются специализированные инструменты, такие как SHAPEIT, Eagle или Beagle. Ошибки фазирования могут привести к дроблению сегментов и снижению точности.

3.  **Идентификация и триангуляция IBD-сегментов**
    *   Определяются сегменты Identity-By-Descent (IBD) между всеми парами протестированных потомков. IBD-сегменты — это участки ДНК, унаследованные от недавнего общего предка.
    *   Для выявления IBD-сегментов используются инструменты, такие как GERMLINE, Refined IBD или Hap-IBD.
    *   Триангуляция - это процесс идентификации IBD-сегментов, которые совпадают у трех или более потомков. Считается, что такой подход помогает подтвердить, что сегмент действительно был унаследован от общего предка, и исключить ложные совпадения или сегменты, полученные от других линий.

4.  **Сборка гаплотипов предка**
    *   Подтвержденные триангулированные сегменты используются для сборки консенсусных гаплотипов предка.
    *   Каждый триангулированный участок может формировать "сборочный блок" гаплотипа, а затем эти блоки "склеиваются" по хромосомам. В случае несовпадения границ сегментов на основе данных разных потомков, может приниматься "большинство голосов" для определения консенсусной границы.
    *   Существуют алгоритмы и инструменты, специально разработанные для реконструкции ДНК предков на основе данных потомков, включая:
        *   **HAPI-RECAP**: Восстанавливает ДНК родителей по данным полноправных братьев/сестер и их родственников.
        *   **HAPI**: Инструмент для воссоздания профиля одного родителя на основе данных трех и более детей и второго родителя.
        *   **"Lazarus" в GEDmatch**: Генерирует "псевдо-набор" ДНК умершего предка, используя данные нескольких потомков.
        *   **RABBIT**: HMM-фреймворк для поблочной реконструкции родовых участков в расширенных родословных.
        *   **ARG-Needle**: Строит генеалогические графы и позволяет извлекать профили предков.

5.  **Импутация недостающих участков**
    *   Поскольку полная реконструкция 100% генома обычно невозможна, остаются пробелы.
    *   Для заполнения этих пробелов (импутации) используются референсные панели, основанные на данных популяций. Это может быть панель общепопуляционных или "быстрофазированных" данных.
    *   Импутация позволяет увеличить покрытие и получить более "плотный" профиль.
    *   Важно учитывать, что выбор референсной панели может внести предвзятость, если она не соответствует вероятному популяционному происхождению предка.
    *   Инструменты для импутации включают Beagle, Minimac и PRIMAL.

**Программные инструменты**

Некоторые из упомянутых инструментов, используемых на разных этапах процесса:
*   Фазирование: Beagle, SHAPEIT.
*   Поиск IBD: GERMLINE, Refined IBD, Hap-IBD.
*   Реконструкция: HAPI-RECAP, HAPI, Lazarus (в GEDmatch), RABBIT, ARG-Needle.
*   Импутация: Beagle, Minimac, PRIMAL.
*   Визуализация и анализ: DNA Painter, GEDmatch. Также возможно создание собственного решения с использованием языков программирования, таких как Python, и библиотек для биоинформатики.

**Ограничения метода**

Несмотря на возможности, метод имеет ряд ограничений:
*   **Неполная реконструкция:** Практически невозможно восстановить 100% генома предка.
*   **Зависимость от данных потомков:** Точность и полнота реконструкции прямо пропорциональны количеству и степени родства протестированных потомков. Чем больше потомков, особенно от разных ветвей семьи, тем лучше. Например, тестирование минимум 4-5 внуков, желательно от разных детей предка, может позволить восстановить до 70-80% генома. Для реконструкции ДНК родителей из четырехдетных семей было в среднем восстановлено 70.6% генотипов.
*   **Сложность различения источников ДНК:** При ограниченном объеме данных может быть трудно точно определить, какие сегменты принадлежат целевому предку, а какие — его супругу или другим предкам.
*   **Проблемы с фазированием:** Ошибки на этапе фазирования данных потомков могут привести к некорректному разбиению или слиянию сегментов.
*   **Ложные IBD:** Без тщательной фильтрации и триангуляции возможно включение в реконструкцию сегментов, которые не были унаследованы от общего предка.
*   **Пробелы и разнообразие данных:** Неполное генотипирование или низкое качество ДНК у потомков может создавать пробелы в покрытии генома предка.

**Экспорт и загрузка результатов**

После реконструкции можно подготовить файл, содержащий реконструированный геном, для загрузки в генеалогические базы данных, такие как GEDmatch. Обычно используются форматы VCF или CSV с определенной структурой. Важно включить только достоверно реконструированные SNP и метаданные о предке. GEDmatch является платформой, которая поддерживает загрузку таких "псевдо-наборов" ДНК, часто через инструмент "Lazarus" в рамках платного уровня доступа (Tier 1). DNA Painter также позволяет визуализировать и работать с реконструированными сегментами.

**Этические аспекты**

Важно учитывать этические моменты, включая получение информированного согласия от всех потомков, чьи данные будут использоваться для реконструкции.

Таким образом, технологически реконструкция аутосомного профиля умершего предка возможна и активно применяется в генеалогических исследованиях с использованием различных инструментов и алгоритмов. Однако конечный результат всегда будет частичным и его точность будет зависеть от качества и количества доступных данных потомков.

https://docs.google.com/document/d/19xmS3KUPk1B7Y-YHX97OrqeT1okqydaneS_4F4oH_Fs/edit?usp=sharing

https://notebooklm.google.com/notebook/3d8c2dc9-0aa1-447e-afc5-9409b043a692?original_referer=https:%2F%2Fnotebooklm.google%23&pli=1
« Последнее редактирование: 12 Мая 2025, 08:11:36 от Val_Metov »

Оффлайн Древ

  • Сообщений: 1133
  • Страна: ru
  • Рейтинг +323/-4
  • Y-ДНК: I-PH1410
  • мтДНК: H5a1a*
Да, Вы отсеете сторонних совпаденцев от супружеских адмиксов.  Но кого Вы увидите в лучшем случае?
Тут ответ, в общем-то, очевиден.
Допустим, есть дальний родственник 5-юродный. Ни у одного из внуков он не высветится, потому что с каждым из них у него, допустим, 5 сМ, что ниже минимума для отображения.
А с искусственным китом деда у него будет, условно, 20 сМ и его будет видно.
Как по мне, основная проблема в методологии самого восстановления кита, которая мне кажется слабой и недостаточной для удовлетворительного результата.

Оффлайн Farroukh

  • Maternal Y-DNA: R1b-FTD83033
  • ...
  • Сообщений: 18926
  • Страна: az
  • Рейтинг +7097/-18
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Всё же я бы рекомендовал на всякий случай профильтровать список совпадений на предмет R-L1029/YP416 и связаться с ними. Ну а вдруг? :)

Оффлайн burstenАвтор темы

  • Сообщений: 8
  • Страна: de
  • Рейтинг +3/-0
  • Потомок казаков Харченко
  • Y-ДНК: R-Y55469
смотрели ли вы детально Белоцерковку, Александровского уезда, Екатеринославской губернии?
Спасибо, Алекс, за вашу внимательность к моему исследованию.
Ответ: Да, одним из первых внимательно прсмтаривали метрики этого населенного пункта.

Вот список мест, что внимательно просмотрены на сегодняшний день:
Екатеринославская   Александровский   Белоцерковка
Киевская   Васильковский   Белая Церковь
Киевская   Черкасский   Белозерье
Киевская   Черкасский   Худяки
Подольская   Балтский   Полянецкое
Подольская   Балтский   Полянецкое
Полтавская   Диканьский р-н   Надежда
Полтавская   Переяславский   Горбани
Полтавская   Лохвицкий   Белоцерковцы
Харьковская   Богодуховский   Зарябинка
Харьковская   Богодуховский   Ямное (Великая Писаревка)
Харьковская   Богодуховский   Корбины Иваны
Харьковская   Богодуховский   Матвеевка, Горбанiвка
Харьковская   Валковский   Бараново
Черниговская   Нежинский   Володькова Девица
Черниговская   Борзенский   Рожновка
Харьковская   Печенежский   Василенково
Харьковская   Волчанский   Отрадное

Результат: Отрицательный

Оффлайн burstenАвтор темы

  • Сообщений: 8
  • Страна: de
  • Рейтинг +3/-0
  • Потомок казаков Харченко
  • Y-ДНК: R-Y55469
Ваш терминальный уровень - R-Y55469 - является нисходящим от R-L1029. Тест Family Finder определяет Ваш уровень как L1029 у тех, кто тестировался ~5 лет назад и как Y416 - у тех, кто протестирован за последние пару-тройку лет.

Поищите среди аутосомных совпадений ~20+ сМ носителей R-L1029 и R-Y416. Свяжитесь с каждым из них на предмет их поднятия до BigY, сразу обозначив, что готовы оплатить апгрейд вместо них, заодно узнайте, что они сами знают о своих прадедах. Что-то Вы точно выясните.

Вот этот ход мысли мне кажется очень привлекательным.
Я уже предложил одной из лабораторий, кто помогает мне в установлении места исхода целевого предка, подобрать мне список кадидатов на BigY тестирование.
Выглядит, как очень понятная фокусировка усилий, большое спасибо за Ваши комментарии.

Оффлайн burstenАвтор темы

  • Сообщений: 8
  • Страна: de
  • Рейтинг +3/-0
  • Потомок казаков Харченко
  • Y-ДНК: R-Y55469
Реконструкция аутосомного ДНК умершего предка
Спасибо. Крутейшая инструкция.
"Бери и делай".
Очень благодарен!

Оффлайн dima75

  • Сообщений: 620
  • Страна: il
  • Рейтинг +138/-1
    • Tartakovsky surname project
  • Y-ДНК: E1b1b1-PF1975 (E-Z830-A)
  • мтДНК: K1a1b1a
Реконструкция аутосомного ДНК умершего предка
Спасибо. Крутейшая инструкция.
"Бери и делай".
Очень благодарен!
Непонятно, как по днк внуков можно отличить днк дедушки от днк бабушки (его жены). Для этого нужны тесты родственников (племянников?) дедушки и бабушки.

Оффлайн burstenАвтор темы

  • Сообщений: 8
  • Страна: de
  • Рейтинг +3/-0
  • Потомок казаков Харченко
  • Y-ДНК: R-Y55469
Для этого нужны тесты родственников (племянников?) дедушки и бабушки.
Либо так, либо:
отсекать по географии происхождения.

Моя прабабушка - казачка в 7 поколениях из станицы Екатериновской.
Все совпаденцы по ДНК из этой станицы - мы сразу относим на счет родни прабабушки, соответственно совпавшие сегменты ДНК на хромосомах не включаем в целевой реконструируемый  профиль ДНК прадеда.

Я протестировал уже 10 станичников с разными фамилиями в станице.
2 из них - родственники по линии прабабушки.
Продолжаю собирать данные.

Оффлайн gecube_ru

  • Сообщений: 1729
  • Страна: hu
  • Рейтинг +347/-7
  • Незнайка на Луне
  • Y-ДНК: I-A6397 -> I-FGC79161
  • мтДНК: V7a1?
Держу пальчики за успех вашего исследования!!!

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.