АвторТема: Генеалогические построения по результатам от Relative Finder  (Прочитано 55519 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Коллеги, хочу с вами поделиться возможными принципами построения филогенетическиг деревьев по результатам от Relative Finder.

Суть моего предложения заключается в следующем, прежде всего необходимо составить двумерную таблицу со всеми персонами из вашего листа. В ячейках таблицы мы указываем дистанцию в поколениях по предиктору.
Опускаем вопрос о том, насколько значения предиктора верны. Это второй вопрос. Просто принимаем их как данность.
Приведу примеры:
Anastasia Kender и я по предиктору 5th Cousin. Т. е. мы шестиюродные братья. Т. е. до общего предка 6 поколений. В соответствующую ячейку ставим 6.
Attila Csordas и я 7th Cousin. То есть 8 поколений до предка.
Yuri Kasimov и я 10th Cousin. Ставим 11.
Daniel Vorhaus и я Distant Cousin. Ставим 12.
Допустим, для многих из моего листа не будет пересечений в их релфайндеровском листе. Ставим 99. (Условно это будет соответствовать бесконечности.
То есть по данным моего листа имеем:
\
MG
AK
AC
YK
DV
MG
\
6
8
11
12
AK
6
\
?
?
?
AC
8
?
\
?
?
YK
11
?
?
\
?
DV
12
?
?
?
\

продолжение следует...
« Последнее редактирование: 15 Январь 2010, 07:51:48 от Mich Glitch »

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Неплохое средство для визуализации с помощью гиперграфов и R-графов.
http://thejit.org/

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Предположим мы получили результаты от всех родичей и заполнили табличку:

\
MG
AK
AC
YK
DV
MG
\
6
8
11
12
AK
6
\
10
99
99
AC
8
10
\
4
5
YK
11
99
4
\
7
DV
12
99
5
7
\

продолжение следует...

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Неплохое средство для визуализации с помощью гиперграфов и R-графов.
http://thejit.org/
Учитываются ли дистанции в поколениях?

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
То, что предложил Михаил, называется kinship matrices. Однако в большинстве случаев в соответствующих программах используется бинарная метрика, у Михаила же - матрицая с использованием пошаговой модели родства.


Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Неплохое средство для визуализации с помощью гиперграфов и R-графов.
http://thejit.org/
Учитываются ли дистанции в поколениях?

Да, это можно запрограммировать путем введения соответсвтующего числа промежуточных узлов-поколений (children-nodes)

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Теперь рассматриваем идеальный случай: все персоны во всех РФ листах имеют только по одному пересечению.

В этом случае, поставив себя в корень и используя привычную Мегу, строим филогенетическое деревцо. Деревце, которое вполне себе ничего отразит существующие связи.

Действительность, увы далека от родства только по одной линии. Мы можем иметь родство с А и с Б. А те в свою очередь имеют близкое родство по линии, не имеющей к нам абсолютно никакого касательства. Нужно вкладывать другие смыслы и вводить новые понятия.

продолжение (чуть попозже - уезжаю на пару часов) следует...

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Мега здесь не пройдет. К тому же для анализа многоуровневых пересечений между всеми узлами, лучше подойдут программы для сетевого анализа.

В принципе с этой задачей должен неплохо справиться Pajek, особенно дизайн модели генетического родства будет представлен в виде P-графов (P-graphs, Petri nets).

http://eclectic.ss.uci.edu/~drwhite/pgraph/p-graphs.html

Но если Вы, Михаил, хотите использовать матрицы (вроде матрицы из первого сообщения в топике) тогда  P-графы не очень удобны и  в этом случае нужно использовать модули для R-графа/Igrah и бинаризировать матрицу.

http://igraph.sourceforge.net/
« Последнее редактирование: 10 Январь 2010, 21:52:55 от Vadim Verenich »

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Мега здесь не пройдет.
Вадим, не спешите.
Меня теребят собирающиеся жена и дочка, но я попытаюсь донести свою идею.
:)
Сетевой анализ не вполне укладыватеся в решение задач, которые ставит генеалогический поиск.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Итак, создаем infile

5
     MG 0 6 8 11 12
       AK 6 0 10 99 99
       AC 8 10 0 4 5
       YK 11 99 4 0 7
       DV 12 99 5 7 0

И строим деревце:

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Какие-то родственные связи поотмечались.
Напомню в чём заключается основное и очень вольное допущение: мы предположили, что каждый из членов выборки связан только одной родственной связью.

На деле - это не так.

Какие можно предпринять попытки?

Первое, что приходит в голову, это ограничиться в таблице данными только с одним УПСом.
Очень теперь хотелось бы услышать мнение Вадима и др. участников нашего форума о том, можно ли это делать, или нельзя.
Если можно, то с какими допущениями.
Если нельзя, то почему.

:)

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Почему я сразу отметаю бинаризацию?
Потому как она не даёт ничего, кроме констатации присутствия родственной связи. Причём что десятиюродное родство, что двоюродное - всё едино.
А ведь релфайндер сразу нам даёт TMRCA в поколениях, которым было бы просто грех пренебречь.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Михаил, так не пойдет. :)
Филогенетический метод всегда оперирует одной генетической линией - неважно будьто Y-хромосома, mito или одна из аутосомных хромосом.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Модератор
  • *****
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Михаил, так не пойдет. :)
Филогенетический метод всегда оперирует одной генетической линией - неважно будьто Y-хромосома, mito или одна из аутосомных хромосом.
Вадим, абсолютно согласен с Вами.
Отбрасываем слово филогенетический. Заменяем его на генеалогический.
Следующим шагом пытаемся выяснить, могут ли данные генеалогические построения сами по себе, без анализа общих фамилий, что-то прояснить. Или же поиск пересекающихся родственных линий можно осуществлять только по поиску общих фамилий.

Задачей данной ветки вижу поиск инструментов и способов обработки получаемых из Релфайндера данных, с учетом зияющих дыр в знании протестированными собственной генеалогии.

Естественно, у меня готовых решений нет, но кое-какие намётки и идеи имеются. Хотелось бы сообща над ними подумать.

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
В принципе, с чисто формальных позиций любую симметричную матрицу расстояний можно превратить в дерево.
 
Однако, за интерпретацию полученных таким образом деревьев я бы не взялся. В силу того, что, как правильно отметил Вадим, УПСы передаются по сочетанным линиям, не обязательно - прямым. Так что смысл полученного дерева будет совершенно неясен.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.