АвторТема: Программа TNT.  (Прочитано 71857 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн I2a1a

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Re: Программа TNT.
« Ответ #30 : 05 Октябрь 2009, 12:41:16 »
Беру несколько гаплотипов-67.
После prepare получаю:
d@Nanc   100011001100000100111001011000011001100110000101010000011111110001010110000110011001100110010111000011011100011100110000111100000111110000010001010001100110011100111001001110001100100110100110000011001111110011100000110010001000010 01
N25315   100000001100000100111001011000011101100111100101000000011111110001010110000100010001000100010111000010011100011100111110111110000111110000010001010001100110111110111101001110001000100110100110000011001111110011100000111000001000010 01
93467    100011001100000110110001010010011001100111000101010100011111111101010110000100011001100110000111000010011100011100111000111000000111111111110001010001100100011100100001001100001110000110100111000011001110010011100000110010001000010 01
93482    100011001100000110110001010000011001000111000101010100011111111101010100000110011001110111000111000010011100011110111000111110000111110000010001010001100100011100110001001100001110000110100111000000001110010011100000110010001000010 01
104256   000011001000100100100001010000000001110100000101010100011111111101000000000100010001000100010111000010011100011000100000100000000111111100010001010001100100011100110001101111101110000110100111000011001110010011100000110010001000010 01
Видно отличие от Ваших данных:
в моём случае в конце строки стоит пробел и двузначное количество гаплотипов. В основном, 01.
Что делать с последними знаками? Слить из с основным массивом или удалить.
Можно слить, а можно удалить. Я их удаляю обычно, но если Вы их сольете с основной матрицой, ничего страшного, так как значение одинаковое во всех строках "01"

Оффлайн mouglley

  • ...
  • Сообщений: 7909
  • Страна: hr
  • Рейтинг +433/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Re: Программа TNT.
« Ответ #31 : 05 Октябрь 2009, 13:33:25 »
Загрузили файл в TNT.

Требуется ли задача каких-то дополнительных параметров или дополнительная обработка данных в TNT?

Оффлайн mouglley

  • ...
  • Сообщений: 7909
  • Страна: hr
  • Рейтинг +433/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Re: Программа TNT.
« Ответ #32 : 05 Октябрь 2009, 13:36:18 »
В Вашем коде есть вопросительные знаки.

Каким образом получить подобный бинар из гаплотипов с пропущенными маркерами?
Разве prepare делает такое?

Оффлайн mouglley

  • ...
  • Сообщений: 7909
  • Страна: hr
  • Рейтинг +433/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Re: Программа TNT.
« Ответ #33 : 05 Октябрь 2009, 13:41:31 »
Какой способ Вы нашли для получения графических файлов из полученных Nexus'ов?

Оффлайн I2a1a

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Re: Программа TNT.
« Ответ #34 : 05 Октябрь 2009, 13:45:42 »
В Вашем коде есть вопросительные знаки.

Каким образом получить подобный бинар из гаплотипов с пропущенными маркерами?
Разве prepare делает такое?

Нет, не делает и Сашин конвертер тоже не делает:). Для получения бинарной матрицы, я  заменяю пропущенные маркеры на модальные значения. После бинаризации  нужно смотреть бинарную метрику с вертикальным столбцами маркеров. Пропущенные маркеры заменять знаком ? исходя из того учета, что метрика бинарная (двоичная) :) :)

Оффлайн mouglley

  • ...
  • Сообщений: 7909
  • Страна: hr
  • Рейтинг +433/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Re: Программа TNT.
« Ответ #35 : 06 Октябрь 2009, 23:29:11 »
Для получения бинарной матрицы, я  заменяю пропущенные маркеры на модальные значения.
Не совсемуловил.
Что такое модальные значения в большой (600 гаплотипов)выборке.
Взять среднее?
Взять присущее предку?

Оффлайн I2a1a

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Re: Программа TNT.
« Ответ #36 : 06 Октябрь 2009, 23:32:52 »
Можно взять модальные значения по непосредственному субкладу гаплогруппы.

Оффлайн Alexander

  • Сообщений: 669
  • Рейтинг +73/-0
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #37 : 09 Октябрь 2009, 13:22:02 »
В Вашем коде есть вопросительные знаки.
Каким образом получить подобный бинар из гаплотипов с пропущенными маркерами?
Пытаюсь освоить ТНТ. Двоичный код для меня показался сложноват, поэтому  я в экселе конвертировал 17-р гаплотипы в формат 0-9, A-V и использовал для ввода данных формат
nstates NUM;
xread
'заголовок'
Tax0 TGAGGA..................
....................................
;
Однако, так как порядок маркеров задать негде, а в описании он не обозначен, перебрал три порядка (ftdna, y-filer, numeric) и в каждом случае ТНТ говорит, что в каком-то месте -не та (чужая) буква или цифра. Естественно, какие у меня маркеры пропущены - в этом случае сказать затруднительно. Подскажите, что нужно сделать, чтобы ввод прошёл?

Оффлайн mouglley

  • ...
  • Сообщений: 7909
  • Страна: hr
  • Рейтинг +433/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Re: Программа TNT.
« Ответ #38 : 09 Октябрь 2009, 14:31:23 »
Пока я только получаю результат по методу, указанному уважаемым Vadim Verenich:
Заряжаю ych в Муркин prepare, а оттуда участок с таксонами вставляю в файл TNT.

Оффлайн Alexander

  • Сообщений: 669
  • Рейтинг +73/-0
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #39 : 09 Октябрь 2009, 15:01:33 »
Пока я только получаю результат по методу, указанному уважаемым Vadim Verenich:Заряжаю ych в Муркин prepare, а оттуда участок с таксонами вставляю в файл TNT.
То есть порядок маркеров у Вас - ftdna... (в ych - ведь такой)? Попробую ещё раз, там ведь какие-то маркеры пропускаются галочками...

Оффлайн ValeryАвтор темы

  • Сообщений: 5523
  • Страна: 00
  • Рейтинг +445/-6
  • Ultimate Matriarchy
Re: Программа TNT.
« Ответ #40 : 09 Октябрь 2009, 15:22:22 »
Пока я только получаю результат по методу, указанному уважаемым Vadim Verenich:Заряжаю ych в Муркин prepare, а оттуда участок с таксонами вставляю в файл TNT.
То есть порядок маркеров у Вас - ftdna... (в ych - ведь такой)? Попробую ещё раз, там ведь какие-то маркеры пропускаются галочками...


А зачем Вам порядок маркеров? Он понадобится только если нужно экспортировать результат ТНТ в какой-то умный формат где дерево можно отобразить с мутациями. Это тоже Нексус. Но читать его вряд ли сможет другая программа кроме ТНТ.

Оффлайн Alexander

  • Сообщений: 669
  • Рейтинг +73/-0
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #41 : 09 Октябрь 2009, 15:48:09 »
А зачем Вам порядок маркеров? ...
Действительно, наверное ни к чему. Но у меня не получается вход. Гаплотип начинается с DYS393=12, DYS390=24.... Программа соглашается с первым маркером (кодируется буквой C), а на 24 (кодируется буквой O) говорит, что alien symbol. Если я подставляю меньшее значение, то соглашается, большее - не соглашается. Я подумал, что ей не нравится порядок маркеров, но при любом порядке с какой-то буквой в гаплотипе она не соглашается. Придётся скачать Мурку и найти Prepare...

Оффлайн Alexander

  • Сообщений: 669
  • Рейтинг +73/-0
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #42 : 14 Октябрь 2009, 14:37:08 »
Ну вот, получилось, вроде с форматом 09-A-V.
В результате имеем 2 дерева для 8 человек G2b2 с "однофамильцев", постороенных в ТНТ по "традиционной" и "новой" технологиям,
(цифры на ветках - пока не знаю в чём, но по сумме равны общей длине дерева=23):

Trees 'G2b2-genofond' by traditional and TNT-method

Matrices will be read as alpha-numeric data
Matrix (17x8, 32 states). Memory required for data:   0.05 Mbytes
0.02 secs.
Best score (TBR): 23.  1 trees retained.
0.02 secs.
xread 'Data saved from TNT'
17 8
SN7036Enga       COFBDHCCBSGGJBD9N
SN9695Enga       COFBDHCCBSGGJBD9N
SO5123Enga       COFADGCCBSGGJBD9N
SD8470Gemk       COFBDICCBSGGJBD9M
SW4234Kras       CPFAFHCCBSGFJBD9L
ST0492Nozd       CPDAAHCCBSGGJBD9M
SF0256Shev       COFAEHBCBTFGJBC9L
SU2492Kire       CNF9EICCBSJFJCEAL

G2b2-genofond/Traditional search
Tree 0. min. branch lengths
     ??0 SN7036Enga
????   ???2 SD8470Gemk
     ??0?   ???0 SN9695Enga
          ?-0?    ???1 SO5123Enga
               ??1?   ???4 SF0256Shev
                    ??2?   ???3 ST0492Nozd
                         ??1?   ???7 SU2492Kire
                              ??1???1 SW4234Kras
0.02 secs.
Tree lengths
       ????????
       ?    +0?
???????????????
?     0?    23?
???????????????

G2b2-genofond/New technology search

Tree 0. min. branch lengths
   ???0 SN7036Enga
   ?          ???2 SD8470Gemk
? ?   ???0???0 SN9695Enga
   ? 0?      ???1 SO5123Enga
        ???1?     ???4 SF0256Shev
               ???2?     ???3 ST0492Nozd
                      ???1?     ???7 SU2492Kire
                             ???1???1 SW4234Kras
0.02 secs.

Теперь можно сравнить результат с аналогичными в Нетворке (см.)
и в Филипе-Меге (см.)
Оконечная вилка Киреев-Красильников одинакова во всех 3-х программах. Более нагладно в Нетворке - видна длина ветки Киреев.
Средняя часть одинакова в Филипе и в ТНТ (Шевченко-Ноздрин), у Нетворка - обратный порядок (Ноздрин-Шевченко).
Ядро, в общем-то одинаково у всех (если взять вар.№2 Нетворка).

Странно, что в ТНТ по графике не видно совпаденцев (Енгалычевых). Тут преимущество опять у Нетворка, хотя в нём помечается только один из совпаденцев, но кружок - большой - понятно.
Почему-то ТНТ по новой технологии объединил Жемкова-Енгалычева, хотя по цифрам ветвей видно, что не нужно бы.

Предварительный вывод: Нетворк даёт более наглядное представление, далее Филип-Мега, ТНТ пока на 3-м месте. Нужно посмотреть по более массовым группам.



Оффлайн ValeryАвтор темы

  • Сообщений: 5523
  • Страна: 00
  • Рейтинг +445/-6
  • Ultimate Matriarchy
Re: Программа TNT.
« Ответ #43 : 14 Октябрь 2009, 15:27:06 »
Цитировать
Предварительный вывод: Нетворк даёт более наглядное представление, далее Филип-Мега, ТНТ пока на 3-м месте. Нужно посмотреть по более массовым группам.


ТНТ не интересуют повторы гаплотипов.

Оффлайн I2a1a

  • ...
  • Сообщений: 10999
  • Страна: ee
  • Рейтинг +755/-8
Re: Программа TNT.
« Ответ #44 : 14 Октябрь 2009, 15:31:58 »
Ну вот, получилось, вроде с форматом 09-A-V.
В результате имеем 2 дерева для 8 человек G2b2 с "однофамильцев", постороенных в ТНТ по "традиционной" и "новой" технологиям,
(цифры на ветках - пока не знаю в чём, но по сумме равны общей длине дерева=23):

Очень интересно, Александр. Цифры на ветвях -стоимость каждого линка.
Как у Вас производился отбор деревьев? Обычно отбираются оптимальные по стоимости деревья.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100