АвторТема: Филогенетическое древо гаплогруппы I1 (Мурка)  (Прочитано 5248 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Аббат БузониАвтор темы

  • Модератор
  • *****
  • Сообщений: 19888
  • Страна: ru
  • Рейтинг +1818/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!
Открываю тему по строительству древа в Мурке по выборке гаплогруппы I1.

Буду задовать все вопросы по этому поводу, которые только могут возникнуть. Самые простые и наивные, Чтобы любому новичку было понятно.

Надеюсь на помощь и ответы уважаемых мною - Валерия, Вертнера, Маугли, Вадима Веренича.

Надеюсь эта тема сможет помочь другим в строительтве своих деревьев.
« Последнее редактирование: 26 Июнь 2009, 18:48:28 от Аббат Бузони »

Оффлайн Аббат БузониАвтор темы

  • Модератор
  • *****
  • Сообщений: 19888
  • Страна: ru
  • Рейтинг +1818/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!
Вопрос первый. Где скачать Мурку?

Оффлайн Centurion

  • 100% Earth (Solar System) genofond
  • Администратор
  • *****
  • Сообщений: 9548
  • Страна: ru
  • Рейтинг +571/-2
Вопрос первый. Где скачать Мурку?

Цитировать
Мурка доступна с августа 2008 по этому адресу:
http://sourceforge.net/projects/phylomurka

Оффлайн Аббат БузониАвтор темы

  • Модератор
  • *****
  • Сообщений: 19888
  • Страна: ru
  • Рейтинг +1818/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!
Какие требования к ПК для установки и работы Мурки?

Оффлайн Аббат БузониАвтор темы

  • Модератор
  • *****
  • Сообщений: 19888
  • Страна: ru
  • Рейтинг +1818/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!
Проехали.

Следующий вопрос. У меня три версии Мурки 1.1.12.; 1.1.4.; 1.1.5.; какая более новая? Или стоит скачать исправленную недавно версию?

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Сегодня была выгружена обновленная версия 1.1.12. Апдейты происходят часто потому что обнаруживаются скрытые баги, которые зачастую в принципе не могут проявиться в текущей версии, но могут активироваться при дальнейшем изменении другой части кода.

Оффлайн Аббат БузониАвтор темы

  • Модератор
  • *****
  • Сообщений: 19888
  • Страна: ru
  • Рейтинг +1818/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!
Скачал два архива:

murka-1.1.12-src.tar.gz        
murka-1.1.12-win.zip   

Извлек. С какой папки начинать?

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Распакуй murka-1.1.12-win.zip - получившаяся папка будет "корнем" Мурки. Далее см. инструкции в теме которую создал Роман.

Оффлайн Аббат БузониАвтор темы

  • Модератор
  • *****
  • Сообщений: 19888
  • Страна: ru
  • Рейтинг +1818/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!

Для определенности будем считать, что вы запускаете Мурку из оболочки bash. Ничего системно-зависимого в Мурке нет поэтому то же самое можно запросто сделать и из-под виндового шелла cmd.

Идем в корень Мурки:

cd <путь к корню Мурки>

Этап 1: создание RDF из YCH

Потребуется запуск программы prepare.

Сначала надо выбрать метрику из двух вариантов, это дела вкуса. Результат будет немного различаться, а иногда и много. Командный файл для запуска поставляется в дистрибутиве, но здесь мы опишем все заново.

a) Метрика без бинаризации - произвольная дискретная метрика. Она задается RDF-файлом и матрицей состояний. Если величины аллелей (ака состояний) лежат в диапазоне 0-50 (что скорее всего так), то матрица нам и не нужна так как уже поставляется в дистрибутиве в папке data/metric.

./prepare -T "YCH2RDF" -S "Y" -V "VP" -I "1" -F "20.0" -i "data/myych.ych" -o "data/myrdf.rdf" -s "data/ymx" -p "INEQ" -d 2 -n 2
-i "data/myych.ych" входной YCH в папке data

-o "data/myrdf.rdf" выходной RDF в папке data

-p "INEQ" значит что мы имеем дело с произвольной задаваемой матрицей дискретной метрикой, без этой опции prepare решит что расстояние скажем между аллелями 11 и 15 не 4 а 1; если на выходе нужна матрица, то надо добавить в этот же параметр опцию MX и еще передать параметр -s но нам он не нужен, в примере выше я оставил его для проформы: как уже говорилось, стандартная матрица расстояний 50x50 в дистре есть.

-d 2 где размер данных 2 символа (что достаточно для кодирования аллелей 11, 12, 13,...)

-n 2 и размер нумерических данных тоже будет 2 (если у нас не будет весов или частот для записи которых не хватит 2 цифр - тогда ставим что надо хоть 100 - и имеем гигантский RDF файл)

b) Метрика с бинаризацией - она же метрика Хэмминга, как в Нетворке: состояния 0 и 1.

./prepare -T "YCH2RDF" -S "Y" -V "VP" -I "1" -F "20.0" -i "data/myych.ych" -o "data/myrdf.rdf" -s "data/ymx" -p "BINARIZE|CONSEQ|SHORTNAMES" -d 1 -n 2
Смысл параметров уже разобрали, рассмотрим только отличия бинарного случая.

-p "BINARIZE|CONSEQ|SHORTNAMES" этот набор опций более всего приближает то что будет на выходе к Нетворковскому варианту. Опция MX нам и на этот раз не понадобится так как матрица для бинарного случая конечно уже есть.

-d 1 Нетворк понимает RDF файлы где размер данных 1 символ и не больше

-n 2 Длина числовых строк пусть опять будет 2, нам хватит

Теперь у нас в руках RDF файл, главное не забыть какой он - бинарный или нет, и какими были значения параметров -d и -n при его создании, они нам понадобятся при запуске Мурки.

PS. Я писал выше команду "./prepare" предполагая что файл лежит в корне Муркиной директории. Но при установке по умолчанию он лежит в папке <корень мурки>/bin или еще конкретнее /usr/local/murka/bin и пути прописаны, поэтому достаточно вызывать исполняемые файлы так:

prepare

а саму мурку:

murka

Под Виндоуз в отличие от Линукса, установщика нет, поэтому нужно проверить перед запуском где лежат бинарники. Должны быть в корне, но не исключено что в будущих релизах появятся установочные скрипты и файлы окажутся в подпапке bin.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.