АвторТема: Генеалогические построения по результатам от Relative Finder  (Прочитано 55861 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Alesh

  • Сообщений: 903
  • Рейтинг +80/-1
в виде similarity matrix.
К сожалению я не понимаю алгоритма заполнения этой матрицы, может объясните для чайников.
Я последний раз упражнялся в математике в институте  21 год тому назад. :-\

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
в виде similarity matrix.
К сожалению я не понимаю алгоритма заполнения этой матрицы, может объясните для чайников.
Я последний раз упражнялся в математике в институте  21 год тому назад. :-\
Alesh, составьте обычную двухмерную матрицу своего ближайшего окружения.
Скажем 10 человек из отсортированного по предиктору листа (самых ближних).
Дело в том, что в этой матрице должны быть не только Ваши данные, но и данные по каждой из персон.
Генеалогическое построение (будем называть графы таким термином) должно отображать связи только тех людей,  что находятся в Вашей 10 х 10 матрице. Иными словами Вы запрашиваете у Ваших совпаденцев данные по людям из этой матрицы. Если связи с лицами нет, ставьте 30. То есть Вы каждому члену матрицы посылаете запрос-просьбу отразить родственные (по предиктору) поколенные глубины только для лиц из матрицы.
Если какая-то из строк не заполнена, то вся затея теряет смысл.

Когда у нас будет эта табличка, мы попробуем её разными способами обработать и сравнить полученное.

Резюмирую: Ваша ближайшая задача предоставить в студию исходные данные.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Кстати, эта просьба не только к Alesh.
Если кто-то может предоставить полностью заполенную таблицу 10 х 10 людей пошедших на контакт из своего релфайндеровского листа - не стесняйтесь.
Сообща потренируемся на ней.
:)

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
1.0
0.0060 1.0
0.0050 0.0040 1.0
0.011 0.0050 0.109 1.0
0.0010 0.0010 0.0050 0.0080 1.0
0.0040 0.03 0.159 0.236 0.163 1.0
0.0050 0.013 0.0050 0.074 0.0090 0.033 1.0
0.0 0.0 0.0 0.0 0.0 0.0 0.0 1.0
0.0020 0.0010 0.014 0.01 0.0030 0.019 0.025 0.0 1.0
0.0040 0.0010 0.0 0.0060 0.0010 0.012 0.0090 0.0 0.0020 1.0
0.017 0.0030 0.464 0.059 0.0080 0.074 0.041 0.0 0.0030 0.0050 1.0
0.406 0.016 0.063 0.031 0.02 0.064 0.0010 0.0 0.0010 0.0040 0.016 1.0
0.0010 0.0010 0.0010 0.017 0.0050 0.0 0.017 0.0 0.0010 0.0020 0.0050 0.0040 1.0
0.0 0.073 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 1.0
0.0030 0.0020 0.0030 0.0020 0.0050 0.045 0.022 0.0 0.0050 0.024 0.012 0.0050 0.0 0.0 1.0

Примерно так, только вместо цифир в этой матрице подставить данные о % sharing DNA

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
1.0
0.0060 1.0
0.0050 0.0040 1.0
0.011 0.0050 0.109 1.0
0.0010 0.0010 0.0050 0.0080 1.0
0.0040 0.03 0.159 0.236 0.163 1.0
0.0050 0.013 0.0050 0.074 0.0090 0.033 1.0
0.0 0.0 0.0 0.0 0.0 0.0 0.0 1.0
0.0020 0.0010 0.014 0.01 0.0030 0.019 0.025 0.0 1.0
0.0040 0.0010 0.0 0.0060 0.0010 0.012 0.0090 0.0 0.0020 1.0
0.017 0.0030 0.464 0.059 0.0080 0.074 0.041 0.0 0.0030 0.0050 1.0
0.406 0.016 0.063 0.031 0.02 0.064 0.0010 0.0 0.0010 0.0040 0.016 1.0
0.0010 0.0010 0.0010 0.017 0.0050 0.0 0.017 0.0 0.0010 0.0020 0.0050 0.0040 1.0
0.0 0.073 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 1.0
0.0030 0.0020 0.0030 0.0020 0.0050 0.045 0.022 0.0 0.0050 0.024 0.012 0.0050 0.0 0.0 1.0

Примерно так, только вместо цифир в этой матрице подставить данные о % sharing DNA
Вадим, я извиняюсь, но Ваш подход дважды неправильный.

1) Мы сразу полезли в изучение программы построения графов. Методически же верно, начать с получения и анализа исходных данных.

2) Процент sharing DNA - это не тот критерий по которому надо работать. У меня максимум 0.33%. И человек определён по предиктору как дальний родственник. В то же самое время совпаденец с жалкими 0.13% обозначен как пятиюродный брат.

Работать надо только по данным от предиктора. Мы абстрагируемся от того, насколько эти данные верны. Методика расчёта будет не раз пересматриваться и уточняться. Мы условно принимаем это TMRCA за верное.

Таким образом, формальная постановка задачи состоит в построении графа на основании имеющейся таблицы TMRCA.

* Напоминаю (для простоты используется только мужской род) :
TMRCA
1
2
3
4
5
Степень родства
брат
двоюродный брат
троюродный брат
четвероюродный брат
пятиюродный брат
English
brother
cousin
second cousin
3th cousin
4th cousin

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Я не думаю, что простое понумерование поколений - это верный подход для составления матрицы.Хотя -errare humanum est
Но в то же время согласен с Михаилом, что одних данных о проценте совпадющего генома не достаточно. Нужно придумать нечто среднее.
.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Впрочем, у меня есть кое-какие идеи. Но на их проработку уйдет время.
Пока мне по существу сказать или показать нечего. :)

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Я не думаю, что простое понумерование поколений
Простое пронумерование поколений - это и есть то, чем Генетическая Генеалогия занималась всё это время: то есть расчёты TMRCA.
Если бы у нас такие времена были по прямым линиям, то большинство задач было бы решёнными.
Мы пытаемся выяснить, можно ли осуществить генеалогическое построение на основе времён и сколько возможных вариантов при этом получится.
Верность оценки  TMRCA остаётся за кадром

То, что такое в принципе возможно показывает простейший пример.
Имея 4 мужчин (Вы, Ваш отец, Ваш двоюродный брат со стороны матери, Ваш двоюродный брат со стороны отца), Вы сможете выстроить (принимая в расчёт и имеющиеся субклады) единственное построение, верно отражающее схему родственных связей.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Поживем-увидим :)

Оффлайн Alesh

  • Сообщений: 903
  • Рейтинг +80/-1
"Иными словами Вы запрашиваете у Ваших совпаденцев данные по людям из этой матрицы."
 
я этим уже давно занимаюсь, даже сайт сделал для удобства сбора информации от "кузенов".
матрицы  по вашему стандарту составлю сегодня.
Посмотрим что из этого получится

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Поживем-увидим :)
Это верно.
Но необходимо иметь исходные данные.
Если не удаётся решить задачу в её простейшем виде, то усложнение обычно приносит мало счастья.
И потом, опять методически неверная конкретика, замена величин не ведёт к изменению постановки задачи.
Иными словами, можно считать TMRCA верными, можно предпочесть проценты, но решение всё равно - одно и то же.
Ведь формальная замена величин, скажем, с метров на ярды, или наномикроны не изменяет самого измеряемого расстояния.

Зри в корень!
©

 :o

Оффлайн Alesh

  • Сообщений: 903
  • Рейтинг +80/-1
Можем ли мы воспользоваться данными уже готовой базы данных
http://the2.3utilities.com:8080/22/
можно ли взять вместо предлагаемых Вадимом % или Михаилом степени родства, сокращенное или полное значение по Lengt?
Можно ли усложнить модель с применением добавочного фактора Chromosome?

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Можем ли мы воспользоваться данными уже готовой базы данных
http://the2.3utilities.com:8080/22/
можно ли взять вместо предлагаемых Вадимом % или Михаилом степени родства, сокращенное или полное значение по Lengt?
В отличии от исходных величин (предлагаемые Вадимом %, или длины УПСов, предлагаемых Вами), степень родства (TMRCA) - это конечные данные. Забудьте про тесты.
Допустим у Вас есть головоломка типа:
- у Васи есть брат Петя;
- у них есть двоюродный брат Саша и троюродный брат Степа;
- Саша и Степа - чевероюродные братья.
Нарисуйте генеалогическое дерево для Васи с указанием всех помянутых персон и их общих предков
.
Мы сейчас совершенно не говорим о том, как на основании количества УПСов, их положения и длины (абсолютной и в сантиморганах) исчислить степень родства.
Мы полученные времена уже полагаетм за верные.

Можно ли усложнить модель с применением добавочного фактора Chromosome?
Можно и позапутывать. Отчего нет? Вместо совершенно бесполезной хромосомы можно взять вполне полезные сантиморганы.
Но ещё раз говорю, допустим у нас уже есть верные конечные данные. То есть матрица степеней родства.
Мы хотим выяснить две вещи:
1) Можно ли на основании этой матрицы построить генеалогическое дерево для заданной персоны.
2) Какием условиям должны отвечать исходные данные с тем, чтобы количесвто получаемых решений стремилось к единице.

Оффлайн Alesh

  • Сообщений: 903
  • Рейтинг +80/-1
Михаил, проверил свою базу-данных, к  сожалению, у меня нет данных  кузенов по TMRCA между собой.
 :(
Придётся поспрашивать.

Оффлайн Alesh

  • Сообщений: 903
  • Рейтинг +80/-1
У меня есть идея, не так давно удалось установить документальную генеалогическую связь с кузеном моей жены. У меня есть все узлы настоящего дерева но только 2 результата теста, что если мы попробуем пробную модель как эксперемент для проверки вашей гипотезы и сравним настоящие дерево с тем, что получится с помощью построенной матрицы и Меги?
Такой вариант подойдёт?

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.