АвторТема: Ирландские гаплотипы группы R1b и атлантический модальный гаплотип  (Прочитано 33552 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Как видно, построенное с помошью нового, интегрированного Валерием в Мурку метода weight heuristic дает в большинстве MP-древ результат, который существенно отличается от древ, построенных с весами-коэффициентами уважаемого wertnera (при e=50 x=50) У меня просьба к Валерию объяснить приниципиальные особенности нового метода.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Спасибо, Игорь за уточнения. Я действительно должен перестроить все эти древа с нуля, поскольку присутствие посторонних гаплотипов сильно искажает топологию выборки.

Спасибо за уточнение определения "звездного кластера". После апргрейда Мурки возникли проблемы с ych файлом кластера Эоганнахтов, хотя по старым файлам выборок I2a проблем нет. Видимо, ошибка в исходных данных файла eogan.ych.

Уважаемый Вадим,

Спасибо за очередное "ирландское" дерево - очень интересное. Некоторые замечания по методике, если позволите: Стоило бы после отбраковки посторонних гаплотипов заново построить дерево в Мурке и посчитать возраст клана по ро-статистике (раз уж она это умеет).

Дело в том, что центральный кластер не такой уж и "звёздный" (хотя очень красив) - но всего пять гаплотипов отходят от центра кластера независимо, остальные - скоррелированно. В этих условиях пи-статистика, которую вы использовали в расчёте, работает плохо. Зато ро-статистика учтёт эту генеалогию и даст более адекватный результат, особенно - в плане расчёта погрешности, сигмы.

Обычно кластер считается "звёздным" если большинство гаплотипов, его образующих, отходят от центра независимо (в идеале - все). Если индекс звёздности = ро/(N*сигма**2) меньше 0.5, то пользовать пи-статистику не стоит - она даст заниженный возраст и ещё значительнее ошибётся в доверительном интервале.

К сожалению, звездные клаcтеры в Y-филогении - редкость, хотя часты в мито-дендрограммах. Так что нам без ро-статистики не обойтись.

P.S. Пока писал, Вы сообщили, что посчитали возраст по Мурке. :) Значит - подумали об одном и том же. Ну и насколько он отличен - где ссылка?

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Это данные по тем же Дал Гаш, с Эоганнахтами ничего пока не выходит

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
После дополнительной проверки и удаления гаплотипов и удаления более "древних" гаплотипов,  и последущей обработки SplitTree и Муркой по династии Эогана Мора получены следущие результаты:

 
 


Оффлайн Centurion

  • 100% Earth (Solar System) genofond
  • Администратор
  • *****
  • Сообщений: 10074
  • Страна: ru
  • Рейтинг +566/-2
...по династии Эогана Мора получены следущие результаты:
А что это за "зверь"?  ???

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Эоган Мор, он же Овэн или Эоган Великий - родоначальник ирландского туата Эоганнахта.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Итак, после процедуры удаления посторонних, а также близкородственных гаплотипов, но имеющих другого предка из начальной выборки Эоганнахта (примерно 90 гаплотипов), осталось примерно 55 гаплотипов, чья принадлежность к туату Эоганнахта практически не вызывает сомнения.

Теперь, с добавлением дополнительных локусов DYS385A и DYS385B имеем 112 мутаций на 55 *19 маркерных гаплотипах. По приведенной выше методике посчитаем время последнего общего предка:

112/55/19=0.107

С поправкой на возвратные мутации (формула Адамова):

0.107/2*(1+exp(0.107))=0.113

Число поколений до последнего общего предка:

0.113/0.002= 56 поколений или 1414-1697 лет до нашего времени

По таблице Адамова-Клесова полученному значению лямбда (округленно 0.11) соответствует 55-58 поколений (последняя цифра с учетом возвратных мутаций), то есть интервалу от 1375 до 1750 года до настоящего времени, что по хронологической шкале соответствует периоду от 3 до 7 века нашей эры.

По полученному в Ytime среднеквадратичному распределению гаплотипов (oASD =  0.13493) ув.Овод получил число  поколений 67.5, что соответствует примерно периоду от 1695 до 2025 года до настоящего времени (т.е от 1 в.н.э до 4 в.н.э)

По разным хронологическим выкладкам в ирландской легендарной истории, время жизни Эогана Мора, родоначальника Эоганнахта (?ogan M?r mac Ailella U? ?ber) относится ко второму или третьему веку нашей эры.



Будем считать, что в данном случае мы имеем дело с "решенным" филогенетическим древом с достоверным модальным гаплотипом, в котором предок равноудален от всех узлов и мутации протекают параллельно. По рассчитанным в Мурке значениям имеем значения Rho 3.3036 и   Sigma 0.4199. Откорректируем по времени предка значение параметра Мурки -N = 1695/3 = 565. Введем этот параметр в Мурку с выводом в графику







« Последнее редактирование: 30 Май 2009, 15:34:33 от Vadim Verenich »

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 34618
  • Страна: ca
  • Рейтинг +2953/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Vadim Verenich, хотел спросить, Ваш ирландский материал уже готов к публикованию? Речь идёт пока о русской версии.
Сами понимаете, формат он-лайн издания позволяет сделать правку в уже опубликованном материале.
Да и печатную версию тоже поменять не мудрено. Если Вы посмотрите на английский номер Вестника, то увидите, что после выхода начальной версии я менял его 9 раз.
Сказанное не стоит воспринимать как призыв давать совершенно сырой материал. Но если есть небольшие сомнения и планы на доработку, то не беда. С этим разберемся.

Извините, что подталкиваю Вас в спину. Но похоже из всех авторов, только Ваш материал уже готов для публикования в Russian Journal of Genetic Genealogy. Задача же наша сейчас разместить хотя бы один материал и начать полновесную раскрутку.

Будете первым.
 :o

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Спасибо Mitch Glitch на добром слове,

Ув. Mitch_Glitch,
В настоящее время материал готов где-то наполовину. Поскольку статья изначально планировалась в качестве панорамной, в готовом варианте ее объем должен быть около 25-30 страниц. Сейчас написано страниц, большая часть написанного материала касается постановки вопроса и реферативного экскурса в работы ирландских генетиков. Статью, конечно, можно разделить на несколько частей, но пока и написанная часть несколько сыровато (нужно привести ее к некоторому академическому стандарту, оформить ссылки, подумать куда разместить иллюстрации и т.д.)
 Собственно представляющий интерес вопрос о  сопоставлении данных "глубоких" родословных и ДНК-генеалогии на примере анализа родства Дал Кайс и Эоганахтов пока в процессе редактирования.
Через неделю у меня будет короткий отпуск, к этому времени я могу подготовить оста

Впрочем, я могу отправить Вам по эл.почте черновик готовой части (сообщите мне адрес в личку). Если Вы сочтете, что в таком усеченном варианте статья пригодна для журнала, то я могу отредактировать эту половину до полноценной половины, а оставшуюся часть оставить для другой статьи.

Оффлайн Mich Glitch

  • Genus regis
  • Сообщений: 34618
  • Страна: ca
  • Рейтинг +2953/-47
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Спасибо Mitch Glitch на добром слове,

Ув. Mitch_Glitch,
В настоящее время материал готов где-то наполовину. Поскольку статья изначально планировалась в качестве панорамной, в готовом варианте ее объем должен быть около 25-30 страниц. Сейчас написано страниц, большая часть написанного материала касается постановки вопроса и реферативного экскурса в работы ирландских генетиков. Статью, конечно, можно разделить на несколько частей, но пока и написанная часть несколько сыровато (нужно привести ее к некоторому академическому стандарту, оформить ссылки, подумать куда разместить иллюстрации и т.д.)
 Собственно представляющий интерес вопрос о  сопоставлении данных "глубоких" родословных и ДНК-генеалогии на примере анализа родства Дал Кайс и Эоганахтов пока в процессе редактирования.
Через неделю у меня будет короткий отпуск, к этому времени я могу подготовить оста

Впрочем, я могу отправить Вам по эл.почте черновик готовой части (сообщите мне адрес в личку). Если Вы сочтете, что в таком усеченном варианте статья пригодна для журнала, то я могу отредактировать эту половину до полноценной половины, а оставшуюся часть оставить для другой статьи.
Я склоняюсь к варианту разбивки материала на куски.
Пусть будет 4-5 кусков всего по 3-4 странички.
Если до предоставления материалов от других авторов достаточных для выпуска следующего номера Вы предоставите следующий кусок, мы просто его приклеим к предыдущему.

Вы себе не представляете насколько Ваша тема горячая.
Сегодня был в центре у мормонов, опять тетка-смотрительница долго и горячо журчала про ирландцев.
Неделю назад про славных кельтов бытописал дедуля-смотритель.
Так получается, что сейчас в Центр ходит всего два-три человека. Так что каждые уши на счету.  :o

Оффлайн Valery

  • Сообщений: 5523
  • Страна: 00
  • Рейтинг +445/-6
  • Ultimate Matriarchy
Как видно, построенное с помошью нового, интегрированного Валерием в Мурку метода weight heuristic дает в большинстве MP-древ результат, который существенно отличается от древ, построенных с весами-коэффициентами уважаемого wertnera (при e=50 x=50) У меня просьба к Валерию объяснить приниципиальные особенности нового метода.


Ув. Вадим, прошу прощения за несколькодневное отсутствие и неучастие, сейчас начинаю возвращаться к делам :)

Отличия.. Да собственно там и нет никакой биологической специфики, скорее всего случилось что-то другое - например, я мог сконвертить ych в rdf с иными чем Вы опциями. Попробую повозиться какая картинка у меня выйдет на eogan.
« Последнее редактирование: 02 Июнь 2009, 03:08:13 от Valery »

Оффлайн Valery

  • Сообщений: 5523
  • Страна: 00
  • Рейтинг +445/-6
  • Ultimate Matriarchy
Попробовал eogan - вот что выходит (правда корень у меня здесь мидпойнт, но это не важно):

http://www.savefile.com/files/2123395


Опции такие, понимаются версией 1.1.11 (которая от предыдущих отличается только штейнеровским солвером, ничего содержательного повторяю там нет. Добавилась штейнеровская редукция CUTRDA которую теперь рекомендуется вставлять в параметры запуска всегда) Посл апдейт от 1 июня


./murka -T "MJ" -S "Y" -V "VP" -I 1 -F 20.0 -H "N" -P "20;1.4;2.25;5000;20;1.4;2.25;5000;0;0.75;500;50;1;" -C "0;50;0;" -M "0; 20; 0; 0; FASTUNION|MORETREES|RESCHECK; 1; 0; 0; SEP1|NTT|NT1|NT2|NTD|LEUC|PS|SL|NV|LE|VR|NTDVR|PT|PTE|DA|SEPDA|NTDX|PTEX|EXTE|EXTV|EXTEEDAP|EXTVDA|EXTVDAP|EXPV|CUTRDA; 0; LBDA|KEEPBND|BNDREPEATS1|BNDPERC2|EXTTEST3|PRUNE2|PROCMSG2|REDPMLEV2|REDREP2|COMPLTRAVERSAL; " -J 0 -X 0 -Y 0 -U 0 -W 0 -Z 0 -d 2 -n 2 -s "BCACHE|DCACHE|THASH" -j "CONSTSPLITS|EQSPLITS|PARTITIONING|ROOTING|POSTPROC|CONTRACTNT2|ALLOWTERMROOT|MIDPOINTROOT|MPSTAT|FORCEQMSN|WPHEUR" -e 0 -x 0 -b 59 -f "" -m 0.4 -t "RDF" -i "../data/seq/eogan.rdf" -r "../data/metric/states_str0050ineq_2_2" -o "SEQTABLE|TAXATABLE|CHARTABLE|CHARCHNGTABLE|NW|NWEXT|STAT|STP|CMATRIX|SCMATRIX|MPWTDMATRIX|MPCOMPTABLE|MPPARTTABLE|MPRFTDMATRIX|MPTOPOTABLE|CHARSTTABLE" -c "cs_" -p "../nw" -q "stat" -u "nwlinktbl#" -O "seq.rdf" -w "distmx" -y "compmx" -E "scompmx" -D "charsttbl" -z "taxatbl#" -a "chartbl#" -k "charchngtbl#" -Q "wtdistmx" -K "rftdistmx" -R "tcmptbl" -B "mpbootbl" -L "mptopotbl" -A "" -N 170 -G "GraphViz; 1; ROOTPREFERRED|DIST|CHNAMES|CHCHNG|TXNAMES|TXFR|TXFRSZ|TXCD|ROOTONLY|TREEONLY|CALL|MPPART; 1.8; 1.1; 0.2; 2.0; 96.0; gif; /usr/local/bin/dot; /usr/local/bin/neato; viz/nw#.dot; viz/nw#.gif; viz/tpl/nwtpl.txt; "
PS. Я выбираю -b 19, 29, 39.. только для ровного счету так как это число дополнительных тестов вдобавок к одному обязательному. Кстати данный пример eogan в вычислительном отношении простой, поэтому можно и дальше увеличить число тестов, наверняка можно уменьшить стоимость решения (см ниже).

PPS. Стоимость решения выше - 4508 тогда как при увеличении эпсилон до 20 я получил стоимость более 5000. Конечно при некотором огромном эпсилон достигается абсолютный оптимум стоимости но никаких мощностей не хватит это расчитать.
« Последнее редактирование: 02 Июнь 2009, 03:06:13 от Valery »

Оффлайн Valery

  • Сообщений: 5523
  • Страна: 00
  • Рейтинг +445/-6
  • Ultimate Matriarchy
Если принять модал за корень то для eogan.ych у меня выходит 1800+-150 лет.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Спасибо, ув.Валерий. Обязательно учту Ваши замечания/поправки по возрасту и протестирую новый параметр солвера. У меня к Вам еще вопрос -@-префиксы у меня перестали работать. Я попробовал задать корень с помощью префикса d@,  поскольку мне нужно было получить на выходе Newick tree (этот формат не поддерживает топологии без корней). Ничего не вышло.

Оффлайн Valery

  • Сообщений: 5523
  • Страна: 00
  • Рейтинг +445/-6
  • Ultimate Matriarchy
Уважаемый Вадим, но не далее как вчера я строил что-то с d@  :)

Версия я так понимаю 11. А какого числа файл? Параметры запуска?

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100