АвторТема: Программа TNT.  (Прочитано 97836 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #180 : 11 Июнь 2010, 22:40:17 »
Мне так кажется, что веса ужесточают ветку - отсекают явно посторонние гаплотипы, и заодно "родные" с 1-2 нестандартными  мутациями.
Вопрос к Оводу - по ASD-методу подсчёта времени. В Вашей утилите прочитал, что 1 rho=694 года. Что это значит?
Например, в Нетворке (тоже rho) при расчёте времён нужно задать время на 1 мутацию. У гаплотипов разной длины оно, похоже, разное. Если брать 67-м и скорость 0,00216 мутаций/маркер/поколение, то на гаплотип = 0,145 мутаций, на год =0,0059 и соответственно, 1 мутация за 173 года. Для 17-маркерных мутации будут реже - при скорости 0,002 нужно задать 1 мутацию за 735 лет (что как-то близко к Вашему числу).
Верно ли я понимаю ситуацию в Нетворке и не следует ди в ТНТ задавать разные rho для гаплотипов разной длины?

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Программа TNT.
« Ответ #181 : 11 Июнь 2010, 23:02:29 »
Мне так кажется, что веса ужесточают ветку - отсекают явно посторонние гаплотипы, и заодно "родные" с 1-2 нестандартными  мутациями.
Вопрос к Оводу - по ASD-методу подсчёта времени. В Вашей утилите прочитал, что 1 rho=694 года. Что это значит?
Например, в Нетворке (тоже rho) при расчёте времён нужно задать время на 1 мутацию. У гаплотипов разной длины оно, похоже, разное. Если брать 67-м и скорость 0,00216 мутаций/маркер/поколение, то на гаплотип = 0,145 мутаций, на год =0,0059 и соответственно, 1 мутация за 173 года. Для 17-маркерных мутации будут реже - при скорости 0,002 нужно задать 1 мутацию за 735 лет (что как-то близко к Вашему числу).
Верно ли я понимаю ситуацию в Нетворке и не следует ди в ТНТ задавать разные rho для гаплотипов разной длины?

Принцип вычисления возраста по ро-статистике совсем в другом.
Во-первых, в Нетворке и Мурке можно рассчитать среднее количество мутаций на гаплотип в филогенетически "решенном" MP-дереве. Собственно, это и есть величина rho в "мутационном" исчислении.
Чтобы сделать оценку возраста выборки, необходимо перевести эту величину в более привычное, "годичное" исчисление. Популяционные генетики в первых работах по "молекулярной датировке" возраста выборок поступали следущим образом. Например в ранней работе о митогаплогруппах индейцев калибровка возраста производилась по пограничной дате (terminus post quem) отделения популяции индейцов от сибирской и восточноазиатской популяции (примерно время появления Берингова пролива -10-11 тыс.лет назад). Эту дату в годах разделили на полученную филогенетическим способом величину rho, получив тем сам выражение величины одного ро в годах (чему оно равнялось, сейчас не могу вспомнить).

В принципе, ничто не мешает параллельно рассчитать возраст выборки по ASD и затем путем деления на величину ро, получить значение одного ро в годах. Когда я строю деревья в Мурке, я использую именно второй метод.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #182 : 12 Июнь 2010, 10:17:21 »
Принцип вычисления возраста по ро-статистике совсем в другом.
Во-первых, в Нетворке и Мурке можно рассчитать среднее количество мутаций на гаплотип в филогенетически "решенном" MP-дереве. Собственно, это и есть величина rho в "мутационном" исчислении. Чтобы сделать оценку возраста выборки, необходимо перевести эту величину в более привычное, "годичное" исчисление.
Спасибо, Вадим за ответ, но прошу доразъяснить: учитывается ли в утилите rho Овода для ТНТ длина гаплотипа? Судя по значению rho=694 года - это значение для 18 маркеров (17+1 признак для укоренения на модальный или "посторонний") и как бы верно... По идее утилита предназначена для любой длины гаплотипа?
« Последнее редактирование: 12 Июнь 2010, 10:39:45 от Alexander »

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #183 : 14 Июнь 2010, 21:05:18 »
И ещё доп.вопрос не в тему ТНТ, но в тему расчёта времени rho. В Нетворке есть опция Time Estimate. Для её использования там нужно пометить Ancestrial node, затем descendent nodes на выделенной ветке (в "решённом" дереве), затем подсчитать - Calculate time. Но перед подсчётом следует установить Mutational rate. Правильно ли я делаю, задавая для 67-марерных гаплотипов 1 мутацию в 173 года, а для 17-маркерных 735 лет? (ориентируясь на соображения, изложенные выше).

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Программа TNT.
« Ответ #184 : 14 Июнь 2010, 21:12:49 »
И ещё доп.вопрос не в тему ТНТ, но в тему расчёта времени rho. В Нетворке есть опция Time Estimate. Для её использования там нужно пометить Ancestrial node, затем descendent nodes на выделенной ветке (в "решённом" дереве), затем подсчитать - Calculate time. Но перед подсчётом следует установить Mutational rate. Правильно ли я делаю, задавая для 67-марерных гаплотипов 1 мутацию в 173 года, а для 17-маркерных 735 лет? (ориентируясь на соображения, изложенные выше).

Мне трудно сказать, ибо я возраст рассчитываю параллельно по ASD и методу КН clade age estimate. Исходя из него и определяю значение одного ро в годах.
Ясно, что для разных гаплотипов он будет разным.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #185 : 14 Июнь 2010, 21:47:31 »
По идее утилита предназначена для любой длины гаплотипа?
Возвращаюсь к утилите Овода для расчёта времён. Он рекомендует укоренять на "посторонний" ближайший, добавляя к исходному списку кодов гаплотипов признак укоренения (например, у гаплотипов выборки код=0, у гаплотипа-корня - код=1)+ задать для корня высокий вес, перевешивающий веса маркеров выборки. Однако при этом меняется rho, так как число как бы маркеров увеличивается на 1 (на код признака). Для 67 маркеров (возможная?) ошибка невелика - 67 или 68 "маркеров" - не так уж важно. Но для коротких, скажем 17 или 18 "маркеров" - "ошибка" возрастает: 1rho=694 года или 735 лет всё-таки существенно...

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Программа TNT.
« Ответ #186 : 14 Июнь 2010, 22:12:02 »
По идее утилита предназначена для любой длины гаплотипа?
Возвращаюсь к утилите Овода для расчёта времён. Он рекомендует укоренять на "посторонний" ближайший, добавляя к исходному списку кодов гаплотипов признак укоренения (например, у гаплотипов выборки код=0, у гаплотипа-корня - код=1)+ задать для корня высокий вес, перевешивающий веса маркеров выборки. Однако при этом меняется rho, так как число как бы маркеров увеличивается на 1 (на код признака). Для 67 маркеров (возможная?) ошибка невелика - 67 или 68 "маркеров" - не так уж важно. Но для коротких, скажем 17 или 18 "маркеров" - "ошибка" возрастает: 1rho=694 года или 735 лет всё-таки существенно...

В первый раз об этом слышу. В TNT не нужно добавлять признак укоренения, первый гаплотип это и есть укореняющий outgroup.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #187 : 15 Июнь 2010, 20:00:12 »
В первый раз об этом слышу. В TNT не нужно добавлять признак укоренения, первый гаплотип это и есть укореняющий outgroup.
Наверное, я не так выразился. Вот ТУТ (на стр.6 ветки этого форума) пример входного файла от Овода с укоренением на постороннего - выборка из 17-маркерных гаплотипов (0-16 маркеры)+признаки снипов (17-32 маркеры). Объяснение ТУТ(на 11 странице форума)
С применением утилиты rho получается 1 rho=379 лет (то есть не как для 17 маркеров - 735 лет, а как для 33 маркеров!).
Этот пример - для полигаплогруппной выборки. Но я делал так и для моно (может неверно?), например, есть выборка R1a, укореняю на постороннего - модал R1b. Ему даю признак другого снипа, получается на 1 маркер больше, чем у гаплотипов выборки.
Результат получается, но может, это лишняя операция?

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Программа TNT.
« Ответ #188 : 15 Июнь 2010, 20:17:18 »
Конечно, скрипт не рассчитан напрямую на вычисление возраста с применением снипов (особенно если число снипов сопоставимо с числом маркеров).
 
Однако эту трудность можно обойти. Для этого нужно перерасчитать среднюю скорость мутации в новом наборе маркеров СТР+снипы. Если принять среднюю скорость СТР-мутациий V1=0.002, а снип-мутаций - много меньшей , (на самом деле она меньше примерно в 10000 раз), то новая скорость набора будет V2=V1*n1/(n1+n2), где n1 - число СТР-маркеров, а n2- число снипов.
 
После этого константу 0.002 в теле скрипта заменить на V2. Вот и всех делов.
 
« Последнее редактирование: 15 Июнь 2010, 20:23:51 от Овод »

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #189 : 15 Июнь 2010, 20:27:30 »
Для этого нужно перерасчитать среднюю скорость мутации с наборе наборе маркеров СТР+снипы.
Проще, наверное, просто пересчитать - нужно, ведь, обычно одно значение на интересующую ветку... Внедряться же в тело, пожалуй, сложновато. Лучше скажите, Овод, нужно ли задавать снип на постороннего (в моём примере выше) или не обязательно?

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Программа TNT.
« Ответ #190 : 15 Июнь 2010, 20:30:43 »
Вадим Вам уже ответил - не нужно.
 
Менять скорость (как и любой другой параметр) в теле скрипта легко - это ведь обычный текстовый файл.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Программа TNT.
« Ответ #191 : 15 Июнь 2010, 21:11:46 »
Игорь,

Можно ли модифицировать Ваш скрипт таким образом, чтобы он на "базальных" предковых ветвях (тех ветвях, которые соединяют узлы MRCA гаплогрупп, субкладов и кластеров) вместо возраста ветви по ро-статистике, производил бы оценку возраста по кросс-дисперсии по формула Нордтведта? Формула Нордтведта:

G(AB) = Var(AB) / 2M,

где Var(AB) -кросс-дисперсия пар гаплотипов из популяции A (например, I1) и популяции B (например, I2b1), М- скорость мутации.

Думаю, что самая трудная задача здесь, как запрограммировать разделение  ветвей
на те, оценка возраста которых дается по ро-статистке, и те, рассчет возраста которых идет по интеркладовой дисперсии.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #192 : 15 Июнь 2010, 21:48:32 »
Менять скорость (как и любой другой параметр) в теле скрипта легко - это ведь обычный текстовый файл.
Поменял, действительно легко. Получилось (оказывается скрипт просто открывается Блокнотом). Правда, потеряло временно актуальность, так как оказалось под чужого постороннего задавать снип не нужно. Тем не менее - спасибо.

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Программа TNT.
« Ответ #193 : 15 Июнь 2010, 21:56:31 »
Цитировать
Можно ли модифицировать Ваш скрипт таким образом, чтобы он на "базальных" предковых ветвях (тех ветвях, которые соединяют узлы MRCA гаплогрупп, субкладов и кластеров) вместо возраста ветви по ро-статистике, производил бы оценку возраста по кросс-дисперсии по формула Нордтведта?
В том-то и проблема, как выделить автоматически осмысленные ветви-клады, чтобы считать именно между ними. Потому что "всех узлов со всеми" - бессмыслица.
 
Но написать программку по вычислению кросс-дисперсии из ТНТ я тоже хотел. Но для любых, выбираемых на дереве двух кладов. Пока отложил это на осень. Если возьмусь - учту и Ваши пожелания.

Оффлайн Alexander

  • Сообщений: 650
  • Рейтинг +73/-1
  • Y-ДНК: J2b
Re: Программа TNT.
« Ответ #194 : 23 Июнь 2010, 22:57:56 »
Нюанс по скрипту rho. Он не действует, если находится в разных папках с выборкой .tnt (например, выборка - на флэшке). Может быть, так и нужно, но, например, MEGA, действует повсюду.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.