Для определенности будем считать, что вы запускаете Мурку из оболочки bash. Ничего системно-зависимого в Мурке нет поэтому то же самое можно запросто сделать и из-под виндового шелла cmd.
Идем в корень Мурки:
cd <путь к корню Мурки>
Этап 1: создание RDF из YCH
Потребуется запуск программы prepare.
Сначала надо выбрать метрику из двух вариантов, это дела вкуса. Результат будет немного различаться, а иногда и много. Командный файл для запуска поставляется в дистрибутиве, но здесь мы опишем все заново.
a) Метрика без бинаризации - произвольная дискретная метрика. Она задается RDF-файлом и матрицей состояний. Если величины аллелей (ака состояний) лежат в диапазоне 0-50 (что скорее всего так), то матрица нам и не нужна так как уже поставляется в дистрибутиве в папке data/metric.
./prepare -T "YCH2RDF" -S "Y" -V "VP" -I "1" -F "20.0" -i "data/myych.ych" -o "data/myrdf.rdf" -s "data/ymx" -p "INEQ" -d 2 -n 2
-i "data/myych.ych" входной YCH в папке data
-o "data/myrdf.rdf" выходной RDF в папке data
-p "INEQ" значит что мы имеем дело с произвольной задаваемой матрицей дискретной метрикой, без этой опции prepare решит что расстояние скажем между аллелями 11 и 15 не 4 а 1; если на выходе нужна матрица, то надо добавить в этот же параметр опцию MX и еще передать параметр -s но нам он не нужен, в примере выше я оставил его для проформы: как уже говорилось, стандартная матрица расстояний 50x50 в дистре есть.
-d 2 где размер данных 2 символа (что достаточно для кодирования аллелей 11, 12, 13,...)
-n 2 и размер нумерических данных тоже будет 2 (если у нас не будет весов или частот для записи которых не хватит 2 цифр - тогда ставим что надо хоть 100 - и имеем гигантский RDF файл)
b) Метрика с бинаризацией - она же метрика Хэмминга, как в Нетворке: состояния 0 и 1.
./prepare -T "YCH2RDF" -S "Y" -V "VP" -I "1" -F "20.0" -i "data/myych.ych" -o "data/myrdf.rdf" -s "data/ymx" -p "BINARIZE|CONSEQ|SHORTNAMES" -d 1 -n 2
Смысл параметров уже разобрали, рассмотрим только отличия бинарного случая.
-p "BINARIZE|CONSEQ|SHORTNAMES" этот набор опций более всего приближает то что будет на выходе к Нетворковскому варианту. Опция MX нам и на этот раз не понадобится так как матрица для бинарного случая конечно уже есть.
-d 1 Нетворк понимает RDF файлы где размер данных 1 символ и не больше
-n 2 Длина числовых строк пусть опять будет 2, нам хватит
Теперь у нас в руках RDF файл, главное не забыть какой он - бинарный или нет, и какими были значения параметров -d и -n при его создании, они нам понадобятся при запуске Мурки.
PS. Я писал выше команду "./prepare" предполагая что файл лежит в корне Муркиной директории. Но при установке по умолчанию он лежит в папке <корень мурки>/bin или еще конкретнее /usr/local/murka/bin и пути прописаны, поэтому достаточно вызывать исполняемые файлы так:
prepare
а саму мурку:
murka
Под Виндоуз в отличие от Линукса, установщика нет, поэтому нужно проверить перед запуском где лежат бинарники. Должны быть в корне, но не исключено что в будущих релизах появятся установочные скрипты и файлы окажутся в подпапке bin.
Продолжение в следующем номере