АвторТема: Удобный формат для передачи генеалогической информации  (Прочитано 52648 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Уважаемые администраторы,
а не могли бы вы перенести ответы #59, 58, 57, 55, 53, 52, 51 в новую ветку, например, под именем "GEDCOM" (или как уважаемый МичГлич решит), под эту же категорию?
Как Вам такое название ветви: Программа выделения прямых фамильных линий из файла GEDCOM?
« Последнее редактирование: 10 Ноябрь 2011, 04:40:50 от Mich Glitch »

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Интересно, а много ли существует генеалогий более 34 тыс. человек? И если да - то каков размер максимального используемого GEDCOM?

Мне известны два больших Гедком файла с десятками тысяч персон:
1) Царствующих дворов Европы.
2) Рюриковичей.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
А у Вас это одно связанное дерево или т.н. "лес" (т.е. набор разъединённых деревьев)?

Посмотрите образец моего еженедельного отчёта.

33731 человек - это все персоналии занесённые в базу.

Из них 11134 человека (33.01% от всей базы) - это мои кровные родственники. Т.е. люди, с которыми я связан хотя бы одним общим предком. (Вот этих кровников я сведу в Гедком файл и зашлю Вам для обработки.)

А 26393 человека (78.25% от всей базы) связаны со мной разными видами родства:
- кровного;
- свояческого (через браки).

Родство духовное (восприемники, поручители и др.) я не учитываю.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Ещё не совсем понятно - что делают программы - когда встречают конфликтующие записи и циклы, тем более - когда даты не известны (а GEDCOM сам по себе позволяет иметь противоречия, и избыточности в записях, где надо принимать решения - чему же всё-таки верить?). Видимо, разработчики программ отладили поведение программ многолетними итерациями, trial and error, которых у меня пока нет. Например, как интерпретируются таги ASSO (гражданские браки, полигамия, инцест, однополые браки итд), и прочие особенности.

Вопрос не очень понятен.

Можно составить Гедком файл совсем без дат. Просто с указанием родственных связей.

Любая генеалогическая программа обычно не позволяет иметь более одного биологического отца, и одной биологической матери.
Случаи, когда приёмные родители отражаются как родные - предусмотрены. Но приёмные родители специально оговорены.

Полигамия тоже не в тему. Это родителей может быть только двое. А детей сколько угодно и от кого угодно.

Однополые браки - никакого отношения к биологическому наследованию не имеют вообще. Если только один из пидаров членов такой, извиняюсь, семейной пары не является биологическим родителем.

Вопросы НДБО лежат совсем в иной плоскости. Если биологический родитель не известен - имеем прочерк. Если же неизвестен сам факт НДБО, то генетические тесты именно для того и призваны, чтобы выявить их.
К слову сказать, в отличии от Римского права, я признаю примат отцовства (материнства) биологического над приёмным.

Оффлайн AnodeАвтор темы

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Как Вам такое название ветви: Программа выделения прямых фамильных линий из файла GEDCOM?

Наверное, хорошо. Вам-то виднее.
(Я только разбираюсь в том - что же конкретно надо.)

Оффлайн AnodeАвтор темы

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1

Посмотрите образец моего еженедельного отчёта.

33731 человек - это все персоналии занесённые в базу.

Из них 11134 человека (33.01% от всей базы) - это мои кровные родственники. Т.е. люди, с которыми я связан хотя бы одним общим предком. (Вот этих кровников я сведу в Гедком файл и зашлю Вам для обработки.)

А 26393 человека (78.25% от всей базы) связаны со мной разными видами родства:
- кровного;
- свояческого (через браки).

Родство духовное (восприемники, поручители и др.) я не учитываю.

Значит, в вашем конкретном случае будет скорее всё же связанное дерево (все Ваши кровники).
Однако хочу понять - существует ли ограничение GEDCOMа в общем случае. Можно ли вести базу данных несвязанных между собой людей?
Почему я спрашиваю - я просто никогда не видел - как легаси программа показывает большие и сложные деревья. Если мы уберём какую-то единственную связь, объединяющую два поддерева (например корневой узел, самую главную персону), что тогда? "Распадётся" ли связный граф на два подграфа и будут ли программы показывать два разделённых графа или же выдадут ошибку, требуя вернуть связующий узел на место, чтобы иметь связный граф? Если программы способны показывать два подграфа-поддерева - это ведь фактически означает возможность вести более одной генеалогии в одном файле. Однако, я где-то наталкивался на ограничение иметь только одну генеалогию, что меня немного и запутало (это ограничение конкретной программы или GEDCOMа вообще?)

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
(Я только разбираюсь в том - что же конкретно надо.)

Скажем, я хочу получить гаплогруппы (игрек и мито) максимального числа своих предков.
Для этого мне надо свести от них вниз прямые линии.

Можно это делать вручную:
1) Строите нисходящее дерево от каждого из предков по порядку.
2) Закрываете ненужные ветви. (Т.е. оставляете только ММММ..., или ЖЖЖЖ...)

Очень это долго и муторно, знаете ли.  :)

Программа может это сделать за секунды и выдать списки групп лиц, подходящих для тестирования.

Если, допустим, родословие по всем предкам мужчинам проработано на 100%, то получим 512 списков.
На самом деле конечно меньше.
Во-первых, инбридинг.
Во-вторых, тупиковые ветви (без мужского потомства).


Плюс ещё неполное введение данных. Поэтому-то и надо, чтобы сводило до последнего нужного человека в цепочке. (Мужчины для игрека, мито для женщин.) А далее с учётом фильтра (нет записи о смерти И возраст менее 90 лет) две подгруппы:
1) Современники.
2) Потомки по прямой линии (мужской, или женской) означенных персон.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Такую он-лайн программу сделай - наплыва от посетителей не будет.  :)

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Ну, и мечтать так мечтать.

Может попробуете какому-нибудь Анцестри.ком, или более жидкому ГенТри, а то и лабораториям типа ФТДНА за оплату тиснуть.

А что, пара-тройка тысяч - тоже деньги.

:)

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Однако хочу понять - существует ли ограничение GEDCOMа в общем случае. Можно ли вести базу данных несвязанных между собой людей?

Конечно можно. Всегда можно ввести людей несвязанных. Отдельные родословные кусты.
Но не надо заморачиваться на алгоритмах перебора!
Делайте просто, при запуске программы спрашивайте явно про референтную персону. Типа, введите имя персоны, для которой осуществляется анализ фамильных линий.

Оффлайн AnodeАвтор темы

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Постепенно становится понятнее. Т.е. GEDCOM основывается на биологических родителях только, а не юридических.
Но если FAM (Family) из HUSB (Husband) и WIFE имеет CHIL, а тот CHIL имеет только биологическую мать, а второй CHIL - только биологического отца?
Т.е. как различаются юридические и биологические? Откуда я знаю - кому присваивать мито, а кому yDNA? Или такого не бывает и везде имеется в виду только биологическое родство, игнорируя юридические семьи?
(я пока чайник в GEDCOMe: может быть и выясню всё автоматически - когда буду строить свои реальные деревья сам и распечатывать их в программе)

Под неоднозначностью имел в виду возможность записать детё как CHIL под FAM, так и FAMC под INDI (персоной).

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Почему я спрашиваю - я просто никогда не видел - как легаси программа показывает большие и сложные деревья.

А Легаси и не показывает большие сложные деревья.

Большие сложные деревья лучше всех показывает Древо Жизни.

Именно поэтому, я Древом и пользуюсь.

Гипотетически около 90% в каком-нибудь исследуем ареале должны быть связаны какими-нибудь формами родства (кровного, или свояческого).

Если этого не происходит, то возможно имеет место сословная разница (скажем роды дворянства, духовенства, представителей разных конфессий). Но учитывая большую гомогенность исследуемых (преимущественно крестьяне), основной причиной того, что какие-то фамильные кусты не пересекаются с общим родственным деревом, являеются ошибки вводы. Самая распространённая из которых - дублирующие персоны.

Работая с Древом, я строю дерево всех родственников. На сегодня туда входит 78.25%.
Затем использую фильтр Не присутствует в дереве. И среди 21.75% отщепенцев  :) , тщательно выискиваю тех персон, кто возможно уже отражён в основной группе.

Очень удобно и чрезвычайно эффективно.

Оффлайн AnodeАвтор темы

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1

Скажем, я хочу получить гаплогруппы (игрек и мито) максимального числа своих предков.
Для этого мне надо свести от них вниз прямые линии.

Можно это делать вручную:
1) Строите нисходящее дерево от каждого из предков по порядку.
2) Закрываете ненужные ветви. (Т.е. оставляете только ММММ..., или ЖЖЖЖ...)

Очень это долго и муторно, знаете ли.  :)

Программа может это сделать за секунды и выдать списки групп лиц, подходящих для тестирования.

Если, допустим, родословие по всем предкам мужчинам проработано на 100%, то получим 512 списков.
На самом деле конечно меньше.
Во-первых, инбридинг.
Во-вторых, тупиковые ветви (без мужского потомства).


Плюс ещё неполное введение данных. Поэтому-то и надо, чтобы сводило до последнего нужного человека в цепочке. (Мужчины для игрека, мито для женщин.) А далее с учётом фильтра (нет записи о смерти И возраст менее 90 лет) две подгруппы:
1) Современники.
2) Потомки по прямой линии (мужской, или женской) означенных персон.

задачу вроде сейчас понял, спасибо

а как увидеть инбридинги и другие интересности в GEDCOMe - буду разбираться

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Постепенно становится понятнее. Т.е. GEDCOM основывается на биологических родителях только, а не юридических.
Но если FAM (Family) из HUSB (Husband) и WIFE имеет CHIL, а тот CHIL имеет только биологическую мать, а второй CHIL - только биологического отца?
Т.е. как различаются юридические и биологические? Откуда я знаю - кому присваивать мито, а кому yDNA? Или такого не бывает и везде имеется в виду только биологическое родство, игнорируя юридические семьи?
(я пока чайник в GEDCOMe: может быть и выясню всё автоматически - когда буду строить свои реальные деревья сам и распечатывать их в программе)

Под неоднозначностью имел в виду возможность записать детё как CHIL под FAM, так и FAMC под INDI (персоной).

Вы понимаете, речь сейчас идёт о том, насколько правильно построен Гедком файл.
Я отмечаю только биологических родителей. Если, к примеру, у ребёнка умер отец, а мать его вышла вторично, то это всего навсего второй муж матери. Но никак не отец ребёнка.

Кто-то ведь в голос орёт - меня, де, интересует только официальная генеалогия. При таком подходе генетическая генеалогия в общем-то и ни к чему.

Я к тому, что не Вам проверять правильность построения Гедком файла. Подразумевается, что он сделан верно.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 36936
  • Страна: ca
  • Рейтинг +3773/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
а как увидеть инбридинги и другие интересности в GEDCOMe - буду разбираться
Да просто, вот примерчики из реального родословия.

То есть у меня по линии ЖЖЖМ идёт тот же самый гаплотип (без учёта мутаций), что и по ЖЖЖЖЖЖМЖМ.

Или, скажем, по ЖЖЖЖМЖМ, то же самое, что и по ЖЖЖММЖМЖЖЖМ.

*** Кстати, по женским линиям и того хлеще (на глазок сужу). Больно муторно было всё вручную вниз сгонять. Подожду, пока Вы программу сделаете.  ::)

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.