АвторТема: Программа TNT.  (Прочитано 97790 раз)

0 Пользователей и 2 Гостей просматривают эту тему.

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4191/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Программа TNT.
« Ответ #345 : 14 Февраль 2012, 13:59:34 »
Попробую написать небольшую инструкцию, по получению на выходе из программы TNT, деревьев в Nexus формате, или вернее в расширенном ньюике.
Инструкция будет ориентирована на пользователей консольной версии TNT (Mac, Linux).
Для пользователей Windows, можно установить cygwin, и пользоваться линуксовой версией TNT.
Или, если мне не изменяет память, в виндовой, оконной верии TNT, можно вводить команды внизу окна, в командную строку.

1) Запускаем TNT, с одновременной загрузкой нашего входного файла:
./tnt proc my_input_file.tnt;

2) Включаем отображение названий таксонов:
taxname=;

3) Открываем файл для записи вывода текстового буфера:
log my_log_file.log;

4) Открываем файл, в который будем сохранять наши деревья. Обратите внимание на звездочку перед названием файла, она обязательна:
tsave *my_tree_file.tree;

5) Запускаем обработку нашего файла. В простейшем случае так:
xmult;

6) Включаем хранение тегов:
ttags=;

7) Запускаем на выполнение, скрипт уважаемого Овода, слегка модифицированный мною:
rho 0;

Цифра в конце команды - порядковый номер дерева, полученный при расчете. Нумерация начинается с нуля.

8) После того как скрипт закончит выполняться, сохраняем полученные возраста узлов, вместе с нашим деревом:
save *;

9) Если при расчете xmult мы получили несколько деревьев, то обрабатываем и сохраняем их все по очереди. То есть, повторяем команды: rho 1; (1-следующее по счету дерево) и save *; и тд.

10) После того, как закончили все расчеты и обработали и сохранили все деревья, закрываем лог файл:
log /;

11) И закрываем файл, содержащий полученные деревья:
tsave /;

12) Заканчиваем работу с программой:
quit;

В результате нашей работы мы получили два файла:
my_log_file.log - содержит вывод текстового буфера,
my_tree_file.tree - содержит деревья, полученные нами.
Оба файла текстовые, и их можно просмотреть в любом текстовом редакторе.

Теперь осталось перегнать тнтшный выходной файл в формат ньюик.
Запускаем мой скрипт конвертер форматов, передав ему в качестве аргумента путь к полученному файлу с деревьями:
python tnt2newick.py my_tree_file.tree

Все. В рабочей директории появился файл с названием my_tree_file.tree.tree
Этот файл можно свободно открыть в любой программе просмотровщике деревьев, например в FigTree.

Результат: получили красивые деревья (с расчитанным возрастом каждого таксона и узла), с возможностью разной визуализации и разбивки по цветам и тд, а также возможность экспорта в другие форматы и многое другое.

PS Необходимые скрипты могу выслать почтой.
PPS  Подробное описание всех команд для TNT.
« Последнее редактирование: 14 Февраль 2012, 14:05:46 от Тунец »

Оффлайн JaG

  • Сообщений: 504
  • Страна: fm
  • Рейтинг +131/-0
  • Y-ДНК: J2a-L556 (Y13511+)
  • мтДНК: H5c2
Re: Программа TNT.
« Ответ #346 : 14 Март 2012, 18:38:54 »
Начал заниматься филогенией J2a, пока не слишком успешно. Использую 64-битную консольную версию, данные (~1200 67-STR 58-SNP гаплотипов) получены с помощью Semargl.

Здраво оценивая свой уровень, начал с готового скрипта aquickie, но результаты получились неудовлетворительные. Очевидно этот скрипт предназначен для задач другого типа.

Соответственно, перешел к xmult, с разными параметрами. Как оказалось  ;D параметры значительно влияют на скорость нахождения решения, но слабо - на результат. Пробовал два разных гаплотипа J2b в качестве корня. Смена корня влияет, насколько могу оценить визуально, только на взаиморасположение небольших ветвей близких к нему. Какой вариант лучше - непонятно. Группирование гаплотипов в веточки-кластеры - очень хорошая, достигается быстро уже на первых субптимальных деревьях, но взаиморасположение ветвей в рамках свободы, оставляемой снип-матрицей, вызывает вопросы. Создается впечатление, что программа сразу попадает в окрестность какого-то локального оптимума, который в итоге и достигается, а реальный остается за пределами ее поиска  ???

Вечером попробую два варианта:
1. только 111-STR гаплотипы
2. только снипированные 67-STR гаплотипы

Хотелпсь бы услышать ваше мнение о возможных ошибках и упущениях.

Update I:
Дерево J2a по 116  111-STR гаплотипам, очевидных проблем нет, но нужно учитывать, что очень многие веточки/кластеры не представлены, зато другие  ::)


   ,-- Root_N53374
   |        ,-- 107132 - J2a-Eur
   |     ,--|  ,-- E10625     \
   |     |  `--|  ,-- 155891    J2a-Caucasus
   |  ,--|     `----- 203106  /
   |  |  |  ,-- E4882              \
   |  |  `--|  ,-- N9960            |
   |  |     `--|  ,-- 128474         J2a-AJ
|--|  |        `--|  ,-- 130745     |
   |  |           `----- 207147    /
   |  |  ,-- 44036 - J2a3-L26
   |  |  |     ,-- N93584 - J2a3b-M67
   |  |  |     |     ,-- M6945 - J2a3b-Arab
   |  |  |     |  ,--|  ,-- N45394  \
   |  |  |     |  |  `----- 139708  / J2a3b-Eur
   `--|  |  ,--|  |     ,-- 145426           \
M410^ |  |  |  |  |  ,--|  ,-- 160239         |
      |  |  |  |  |  |  `--|  ,-- 86809        J2a3b-Carrico
      |  |  |  `--|  |     `--|  ,-- 197948   |
      |  |  |     |  |        `----- 143924  /
      |  |  |     |  |     ,-- 204147                 \
      |  |  |     |  |     |  ,-- 175437               |
      |  |  |     `--|  ,--|  |  ,-- 29156             |
      |  |  |        |  |  `--|  |     ,-- 51341       |
      |  |  |        |  |     `--|  ,----- 119126       J2a3b3-L210
      |  |  |        |  | <L210  |  |     ,-- 19601    |
      `--|  |        |  |        `--|  ,----- 73196    |
         |  |        `--|           `--|  ,-- 73061    |
         |  |           |              `----- 47984   /
         |  |           |     ,-- 156740 \
         |  |           |  ,----- 143903   J2a3b-M67
         |  |           |  |  ,-- 21636  /
         |  |           `--|  |  ,-- M6910 -J2a3b1-M92-?
         |  |  <M67        `--|  |        ,-- 39654      \
         |  |                 |  |     ,----- 8917        |
         |  |                 `--|  ,--|  ,-- 112883        J2a3b1-M92
         |  |               M92> |  |  `--|  ,-- 91003    |
         |  |                    |  |     `----- 185398  /
         |  |                    `--|     ,-- N11704                               \
         |  |                       |  ,----- 46925                                 |
         |  |                       |  |  ,-- 196489                                |
         |  |                 L556> `--|  |  ,-- 112842                             |
   L26>  `--|                          `--|  |     ,-- 69509                        |
            |                             `--|  ,--|  ,-- 70867                     |
            |                                |  |  `----- 50911                     |
            |                                `--|  ,-- N29103                       |
            |                                   |  |  ,-- 175667                    |
            |                                   `--|  |  ,-- 150661                   J2a3b1b-L556-WIRTH
            |                                      `--|  |     ,-- 119546           |
            |                                         |  |  ,--|  ,-- 211627        |
            |                                         `--|  |  `----- 163184        |
            |                                            |  |     ,-- 71691         |
            |                                            `--|  ,--|  ,-- 28730      |
            |                                               |  |  `----- 163        |
            |                                               `--|     ,-- 36358      |
            |                                                  |  ,----- 8811       |
            |                                                  `--|  ,-- 50626      |
            |                                                     `----- 5984      /
            |        ,-- 217812 \ J2a3-L26
            |     ,----- 204382 /
            |  ,--|  ,-- M6903 - J2a3a-M47
            |  |  `--|  ,-- N96517 -  J2a3-L26
            |  |     `----- N13746 - J2a3d-M319
            |  |     ,-- 207796 - J2a3-L26
            |  |     |     ,-- 181393            \
            |  |     |  ,----- 176675             |
            |  |  ,--|  |     ,-- 164224          |
            |  |  |  |  |  ,--|  ,-- 139704       |
            `--|  |  `--|  |  `----- 186370       |
               |  |     |  |     ,-- 201965        J2a3-AMMed
               |  |     `--|  ,--|  ,-- 196981    |
               |  |        |  |  `----- 176682    |
               |  |        `--|     ,-- N3741     |
               |  |           |  ,----- 160878    |
               |  |           `--|  ,-- 155687    |
               |  |              `----- 190125   /
               `--|     ,-- 210818         \
                  |  ,--|  ,-- N17517       |
                  |  |  `--|  ,-- 25567       J2a3-Montgomery
                  |  |     `--|  ,-- 96563  |
                  |  |        `----- 37060 /
                  |  |        ,-- 35477 - J2a3h-?
                  |  |     ,----- N14560 - J2a3h2b-L229-Aburto
                  |  |     |     ,-- 12071     \
                  |  |  ,--|  ,--|  ,-- 2031     J2a3h2-Cohen-xL254
                  `--|  |  |  |  `----- 108293 /
                     |  |  `--|  ,-- 171660        \
                     |  |     |  |     ,-- 124775   |
                L24> |  |     `--|  ,----- 19514      J2a3h2e-L254-Katz
                     |  |        `--|  ,-- 133211   |
                     |  |           `----- 40362   /
                     |  |        ,-- 125514 - J2a3h2-L25
                L25> `--|     ,--|  ,-- M6856 - J2a3h2-?
                        |     |  `----- 190393 - J2a3h2-Al-Ahsa
                        |  ,--|  ,-- 112552 - J2a3h2f1-L271-Msaken
                        |  |  `--|  ,-- M6575 - J2a3h2-DYS413a19
                        |  |     `--|  ,-- 220679        \
                        |  |        `--|  ,-- 201790       J2a3h2-Najd
                        |  |           `--|  ,-- 201791   |
                        `--|              `----- 188879  /
                           |     ,-- 15299 - J2a3h2a-UK
                           |  ,--|  ,-- 65789 \ 
                           |  |  `----- 56667 / J2a3h2a2-L270-Cress
                     Z387> `--|  ,-- 183028 - J2a3h2a1d-P244.2
                              |  |  ,-- 23148                        \
                         L70> `--|  |  ,-- E14220                     |
                                 `--|  |     ,-- 207923               |
                                    |  |  ,--|  ,-- 207242            |
                                    `--|  |  `----- 101676            |
                                       |  |     ,-- 118777              J2a3h2a1-L70
                                       `--|  ,----- N52979            |
                                          |  |  ,-- 87915             |
                                          `--|  |     ,-- 201420      |
                                             `--|  ,----- 132800      |
                                                `--|  ,-- 209115      |
                                                   `----- 204221     /         

Update II:
Произвел небольшие манипуляции над данными   ;)  , взял тот же корень, что и для 111-STR дерева, и начали выходить правдоподобные и похожие между собой деревья J2a.

Update III:
Обнаружился баг, при запуске BLENGTH (branch length) на дерево ~1200 67-STR гаплотипов программа виснет, хотя для дерева 120 111-STR гаплотипов возвращает результат менее, чем за секунду. Увеличие доступной для программы памяти (MXRAM) и текстового буффера (TXTSIZE) не помогли. Хотелось оценить плотность/компактность выявляемых ветвей, но увы  :(

Итого в консольной версии:
- нет многопоточности;
- для оценки "расстояния" между узлами нужно писать скрипт, что очевидно сделал Овод при вычслении Rho.
« Последнее редактирование: 19 Март 2012, 01:01:48 от JaG »

Оффлайн kaa76

  • Сообщений: 631
  • Страна: ru
  • Рейтинг +214/-0
  • Y-ДНК: R-L1029
  • мтДНК: U5a2a2
Re: Программа TNT.
« Ответ #347 : 25 Март 2012, 00:41:59 »
Вышла новая версия программы TNT 1.1 от 23.03.2012.
Последние изменения в программе:
  • Improved bounding for Fitch/Farris characters (under prior weights) in exact solutions (ienum command). This makes execution significantly faster for larger data sets (i.e. 14 or more taxa) with good structure; it does not make much of a difference for smaller and noisy data sets. In case you want to compare, the previous implementation is retained as the "ienum-" option (available only via commands).
  • Documented the pcrprune command, which implements Pol and Escapa's (2009) iterative PCR nethod. Also, fixed some bugs in this command (which are unlikely to have affected anybody, since the command itself was undocumented. [ Diego Pol ]
  • Added the forfiles scripting command, and thus also the expressions curwd, curfile, and curisdir.
  • Added the bandb scritping command, and thus also the expressions bbtax and bbfull.
  • Windows only: made further improvements to tree displaying when fitting to screen.
  • Scripting: defining a default target for goto did not work when the error occured inside sprit, tbrit, combine, or iterrecs command. It should work always now.
  • The help for the expression distnode listed it as "distnod"; the correct name is used now. [ Martín Ramírez ]

Оффлайн kaa76

  • Сообщений: 631
  • Страна: ru
  • Рейтинг +214/-0
  • Y-ДНК: R-L1029
  • мтДНК: U5a2a2
Re: Программа TNT.
« Ответ #348 : 26 Март 2012, 01:22:28 »
Накидал небольшую инструкцию по построению деревьев в TNT для продвинутых пользователей.
Критика приветствуется.


Update1: Я так и не нашел rho-скрипт последней версии и не понял как перегонять возраст узлов в tre-файлы.
« Последнее редактирование: 26 Март 2012, 01:59:40 от kaa76 »

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4191/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Программа TNT.
« Ответ #349 : 26 Март 2012, 09:44:21 »
Накидал небольшую инструкцию по построению деревьев в TNT для продвинутых пользователей.
Критика приветствуется.


Update1: Я так и не нашел rho-скрипт последней версии и не понял как перегонять возраст узлов в tre-файлы.
Александр,
хорошее начинание. Инструкция необходима.

Если Вы все делали по приведеному мной алгоритму, но возраста не сохраняются в файл дерева, это значит что Вы применяете немодифицированный скрипт Овода.
Для сохранения возрастов и мутаций в тегах необходимо в файле скрипта закомментировать строки:
ttags ;
ttags -;
В принципе, достаточно только закомментровать одну строку ttags -;, но строку ttags ; я так же комментирую, для уменьшения "шумного" вывода в консоль.

И еще один совет. В начале файла со скриптом есть строка, объявляющая количество используемой памяти: macro [100000;. Для работы с большим количеством гаплотипов и/или маркеров в гаплотипе, советую увеличить значение, как показано выше, до 100000. Иначе программа будет "вылетать".

Насчет сохранения в NEXUS формат через меню Data - Export (Nexus format), то это "прокатит" не во всех случаях. Например при использовании некоторых символов в именах таксонов, при использовании длинных имен таксонов, при сохранении нескольких деревьев в один файл, могут быть (почти 100% будут) ошибки при сохранении. Такой способ подходит только для экспорта маленьких деревьев, с простыми названиями таксонов.

По поводу замены запрещенных знаков в именах таксонов.
В идеале должны быть использованы только букво-циферные символы из ASCII.
Необходимо заменить _все_ символы, кроме A-Z 0-9 на _


Оффлайн kaa76

  • Сообщений: 631
  • Страна: ru
  • Рейтинг +214/-0
  • Y-ДНК: R-L1029
  • мтДНК: U5a2a2
Re: Программа TNT.
« Ответ #350 : 26 Март 2012, 12:24:44 »
Если Вы все делали по приведеному мной алгоритму, но возраста не сохраняются в файл дерева, это значит что Вы применяете немодифицированный скрипт Овода.
Я обновил инструкцию - написал что надо добавить в конец .tnt-файла, чтобы автоматом сохранялось в .tre-файл.

По поводу замены запрещенных знаков в именах таксонов.
В идеале должны быть использованы только букво-циферные символы из ASCII.
Необходимо заменить _все_ символы, кроме A-Z 0-9 на _
Да, как я и писал, я заменял тире и пробелы на подчеркивание. На примере базы гаплотипов из semargl.me - в подгруппе Antes было 2 таких. И деревья потом нормально передались в .nex-формат. FigTree открыл и отрисовал. Но в nexus-формат деревья передаются без возрастных меток.

Кроме того, скинув все данные в .tnt-файл после работы, я обнаружил, что веса задаются только для первых 67 маркеров, а их там 710 в силу перевода через DNA-формат. То есть нужно, всё таки бинаризировать данные через prepare от Valery?
« Последнее редактирование: 26 Март 2012, 16:05:44 от kaa76 »

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4191/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Программа TNT.
« Ответ #351 : 26 Март 2012, 16:30:16 »
Кроме того, скинув все данные в .tnt-файл после работы, я обнаружил, что веса задаются только для первых 67 маркеров, а их там 710 в силу перевода через DNA-формат. То есть нужно, всё таки бинаризировать данные через prepare от Valery?
Я использую базовый формат данных для TNT.
Цитировать
By default, up to 16 states are allowed by xread, using symbols 0-9 to indicate states 0-9, and A-F to indicate states 10-15. This can be changed with the nstates command, which defines the number of states (and data type) to be subsequently read; using the menus, this can be changed with Format/DataType.
То есть, для обозначения значения одного маркера, используется всего один символ.

На примере набора данных для всех гаплотипов R1a -используется матрица на 32 состояния.
16 состояний слишком мало чтоб закодировать разброс значений маркеров у R1a.

Попробую пояснить на примере.
Мы имеем 4 12-маркерных гаплотипа:
Kyrgyz   13   25   15   11   11   14   12   12   10   13   11   30
Malopol 13 25   16   10   11   14   12   12   10   13   11   30
Neur 13   25   16   10   10   16   12   11   11   14   11   32
NS 13   25   17   11   11   14   12   12   10   13   11   30

Первое что надо сделать в файле с набором данных - объявить какую матрицу мы используем. (Обязательно, только если матрица отличается от дефолтной nstates 16)

Далее беремся за кодирование самих значений маркёров.
Сначала необходимо вычислить минимальное значение каждого маркёра во всем наборе данных.
Получаем:
13 25 15 10 10 14 12 11 10 13 11 30

Далее получаем разницу между имеющимся значением и минимальным значением набора данных, для каждого гаплотипа поочередно.
Для киргиза:
13-13=0
25-25=0
15-15=0
11-10=1
11-10=1
14-14=0
12-12=0
12-11=1
10-10=0
13-13=0
11-11=0
30-30=0
(Если значение маркёра или снипа нам неизвестно - мы можем заменить его знаком '?' Это огромнейший плюс программы TNT!!!)
Итого для киргиза мы получаем строку:
000110010000

Для гаплотипа из малопольской ветви: 001010010000
Для невра: 001002001102

Для североморца: 002110010000

Значит пишем в наш файл с набором данных для TNT:

nstates 16
xread 12 4
kyrgys 000110010000
malopol 001010010000
neur 001002001102
ns 002110010000
;
cnames
{0 393;
{1 390;
{2 19;
{3 391;
{4 385a;
{5 385b;
{6 426;
{7 388;
{8 439;
{9 389i;
{10 392;
{11 389ii;
;
ccode +[0.11 /54 0 /50 1 /51 2 /53 3 /49 4 /46 5 /73 6/56 7 /48 8 /51 9 /60 10 /45 11;


Небольшой комментарий.
nstates 16 - матрица из 16ти состояний
xread 12 4 - команда прочитать 4 таксона по 12 маркеров
cnames - объявляет название используемых в расчетах маркеров. Это можно пропустить.
ccode +[0.11 - указывает программе, что маркеры с нулевого (счет ведется с нуля!) по одинадцатый надо объявить аддитивными.
Далее объявляются веса. /54 0 - нулевой маркер (первый по счету) будет иметь вес 54. ЕМНИП максимальный вес - 99.
Следим внимательно за пробельными символами. У вас я заметил несколько ошибок при объявлении весов.

PS И не забываем что укоренение происходит на самый первый объявленный гаплотип. Поэтому в случае использования файла с четырьмя гаплотипами, созданного нами выше, мы получим дерево, укорененное на киргиза.
:)
« Последнее редактирование: 26 Март 2012, 16:52:46 от Semargl »

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4191/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Программа TNT.
« Ответ #352 : 26 Март 2012, 16:44:10 »
Про использование снипов:
В вики написали что необходимо указать для снипов вес 20, это при том что для некоторых маркеров был использован очень большой вес - 73 и даже 99. Это в корне неправильно, так как получается что снипы имееют почти наименьший приоритет, чем все СТРы.
Снипы всегда должны иметь максимальный вес среди всех значений.

Применять или не применять веса, для расчетов - решение конечно за вами, но я, как и уважаемый Игорь (Овод) против применения весов.
Во всяком случае, пользоваться ими надо с большой осторожностью, потому что для разных наборов данных могут быть актуальны разные наборы весов.
Поэтому для всех маркеров я задаю вес 0, а для снипов 99.

Оффлайн kaa76

  • Сообщений: 631
  • Страна: ru
  • Рейтинг +214/-0
  • Y-ДНК: R-L1029
  • мтДНК: U5a2a2
Re: Программа TNT.
« Ответ #353 : 26 Март 2012, 16:57:47 »
Поэтому для всех маркеров я задаю вес 0, а для снипов 99.
Но существует 3 состояния SNP:
  • тест не проводился
  • положительный результат
  • отрицательный результат
Таким образом SNP-маркеров будет в 2 раза больше, чем их нужное количество для исследования, т.е. нужно их двоить - SNP+ и SNP- и проставлять веса 99

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4191/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Программа TNT.
« Ответ #354 : 26 Март 2012, 17:05:20 »
Поэтому для всех маркеров я задаю вес 0, а для снипов 99.
Но существует 3 состояния SNP:
  • тест не проводился
  • положительный результат
  • отрицательный результат
Таким образом SNP-маркеров будет в 2 раза больше, чем их нужное количество для исследования, т.е. нужно их двоить - SNP+ и SNP- и проставлять веса 99
Я наверное еще только дописывал пост, а вы его уже прочитали :)
Цитировать
(Если значение маркёра или снипа нам неизвестно - мы можем заменить его знаком '?' Это огромнейший плюс программы TNT!!!)

Состояние снипа можно закодировать следующим образом:
0 - отрицательный
1 - положительный
? - неизвестен

Оффлайн mouglley

  • ...
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Re: Программа TNT.
« Ответ #355 : 26 Март 2012, 17:07:06 »
Я использую метод, который как раз и описан здесь:
http://forum.molgen.org/index.php/topic,744.msg132451.html#msg132451
Правда, помню, что как-то срабатывали веса для снипов 999
Для стр веса брал те, которые приведены в wiki.

Оффлайн JaG

  • Сообщений: 504
  • Страна: fm
  • Рейтинг +131/-0
  • Y-ДНК: J2a-L556 (Y13511+)
  • мтДНК: H5c2
Re: Программа TNT.
« Ответ #356 : 26 Март 2012, 17:14:44 »
Правда, помню, что как-то срабатывали веса для снипов 999
Да, я испoльзую вес 999 для снипов.

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4191/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Программа TNT.
« Ответ #357 : 26 Март 2012, 17:16:10 »
Правда, помню, что как-то срабатывали веса для снипов 999
Пробежался по ТНТшному мануалу. Не нашел ограничений по максимальному весу. Поэтому вполне возможно что и 999 и 99999 подойдут :)

Оффлайн kaa76

  • Сообщений: 631
  • Страна: ru
  • Рейтинг +214/-0
  • Y-ДНК: R-L1029
  • мтДНК: U5a2a2
Re: Программа TNT.
« Ответ #358 : 26 Март 2012, 17:17:19 »
И не забываем что укоренение происходит на самый первый объявленный гаплотип.


Я в инструкции явно указал, что нужно строить модальный гаплотип или, по совету Овода, взять модал из сестринской гаплогруппы.


Update2: Веса для снипов теперь посоветовал ставить в 99991000
« Последнее редактирование: 30 Март 2012, 21:59:01 от kaa76 »

Оффлайн Semargl

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 5994
  • Страна: ru
  • Рейтинг +4191/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Re: Программа TNT.
« Ответ #359 : 26 Март 2012, 17:22:17 »
Update III:
Обнаружился баг, при запуске BLENGTH (branch length) на дерево ~1200 67-STR гаплотипов программа виснет, хотя для дерева 120 111-STR гаплотипов возвращает результат менее, чем за секунду. Увеличие доступной для программы памяти (MXRAM) и текстового буффера (TXTSIZE) не помогли. Хотелось оценить плотность/компактность выявляемых ветвей, но увы  :(
BLENGTH на 2,5 тыс гаплотипов отрабатывает за доли секунды. Машина: 32-битный Linux с древним процом - 'Intel(R) Pentium(R) 4 1.70GHz'

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.