АвторТема: Новый калькулятор ВБОП с возможностью построения филодерева на сайте SEMARGL.ME  (Прочитано 17196 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 6009
  • Страна: ru
  • Рейтинг +4220/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
При попытке построить дерево с включением в перечень любого вот из этих двух китов - вместо дерева выходит ошибка:
Error 500

киты:
121192,192971

Баг? Или где-то в данных этих китов что-то не так? Что в них не так не нашел  :(
Я знаю эту проблему. Решу в ближайшее время. Причина - умлауты в названии китов. Тоже самое будет и с кириллическими именами.
Исправил.

Оффлайн dmpir

  • Данков
  • Сообщений: 677
  • Страна: ru
  • Рейтинг +98/-3
  • R1a1(BY32008)
  • Y-ДНК: R1a1a1g (M458>CTS11962>L1029> FGC66323>YP6048>BY32008)
  • мтДНК: HV9A
Могу попросить тех, кто уже потренировался, прогнать на ВБОП меня "B1359" с "278552" ? У него вчера готова еще одна панель (будет 67). Пока кажет дистанцию 2. Документально мы 12тиюродные (+/- 1).

Оффлайн Andymeon

  • Сообщений: 1179
  • Страна: ru
  • Рейтинг +119/-5
  • Y-ДНК: R1a [CTS 3402+ Y2910+ YP310+]
  • мтДНК: H3i
Цитировать
Количество сравниваемых образцов должно быть больше трех!
Блин, гдеж третьего взять  ::)

ага, понятнее стало...
Какая наглядо классная штука!

Semargl, я в восхищении!  :D

И это наглядная агитация к увеличению числа маркеров  ;D
« Последнее редактирование: 03 Февраль 2014, 20:08:28 от Andymeon »

Оффлайн Andymeon

  • Сообщений: 1179
  • Страна: ru
  • Рейтинг +119/-5
  • Y-ДНК: R1a [CTS 3402+ Y2910+ YP310+]
  • мтДНК: H3i
Ринат, наверно мутаций много  :)

Оффлайн Andymeon

  • Сообщений: 1179
  • Страна: ru
  • Рейтинг +119/-5
  • Y-ДНК: R1a [CTS 3402+ Y2910+ YP310+]
  • мтДНК: H3i
Ринат, а почему по базе Семаргла у 237607 и 193684 при выборе 67 маркеров формируется 69 маркеров?  ::)

Если только
Цитировать
4) Калькулятор очень чувствителен к многошаговым мутациям и реклохам.
5) Желательно исключать из расчетов известные гаплотипы с гомоплазией к основной части выборки. Снипы в расчет не принимаются.
« Последнее редактирование: 03 Февраль 2014, 21:32:58 от Andymeon »

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 6009
  • Страна: ru
  • Рейтинг +4220/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
http://radikale.ru/data/upload/0fccf/fb1a9/5b5fe47f4a.png Почему получается такой большой возраст до общего предка ?
4) Калькулятор очень чувствителен к многошаговым мутациям и реклохам.
http://forum.molgen.org/index.php/topic,6579.msg223688.html#msg223688

Гаплотип 19402 не будет правильно обработан по причине его dys447.

PS Andymeon опередил меня. Молодец.

Оффлайн Ринат

  • Сообщений: 2573
  • Страна: ru
  • Рейтинг +417/-6
  • I1 M227
Исключил Все равно получается почти 6 тыс лет  Почему ?

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 6009
  • Страна: ru
  • Рейтинг +4220/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Исключил Все равно получается почти 6 тыс лет  Почему ?
4) Калькулятор очень чувствителен к многошаговым мутациям и реклохам.
http://forum.molgen.org/index.php/topic,6579.msg223688.html#msg223688

Для использования калькулятора, придется подучить некоторую матчасть.
Калькулятор использует метод кластеризации по матрице расстояний и естественно уступает филогенетическим программам, да и не ставилось такой цели. Основное назначение калькулятора - возможность быстро получить результат и прикинуть что к чему. На полученной вами схеме сразу видно несколько гаплотипов явно отброшенных программой. При их рассмотрении мы видим у двоих из них сильно отличающееся от других значение dys447, они и увеличили возраст всего дерева. Далее мы видим реклох в dys464 - значит надо исключить этот маркер из расчетов, так как он искажает конечную картину и расчет. Еще на этой выборке можно удалить CDY.
В алгоритмах построения дерева, основанных на character-based методе такие проблемы можно обойти, но это соответственно требует больших ресурсов от сервера, что я не могу позволить по очевидным причинам.

Как заключение: пробуйте, анализируйте, изучайте. Особенно обратите внимание на стабильные группы гаплотипов, на структуру которых не влияет изменение количества и состава выборки - их уже можно выделять в небольшие кластеры.

Оффлайн Аббат Бузони

  • ...
  • Сообщений: 19888
  • Страна: ru
  • Рейтинг +1818/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!
И это наглядная агитация к увеличению числа маркеров  ;D

100 пудов  ;D

Оффлайн Andymeon

  • Сообщений: 1179
  • Страна: ru
  • Рейтинг +119/-5
  • Y-ДНК: R1a [CTS 3402+ Y2910+ YP310+]
  • мтДНК: H3i
И это наглядная агитация к увеличению числа маркеров  ;D

100 пудов  ;D
Аббат Бузони, по ссылке
http://forum.molgen.org/index.php/topic,6579.msg223710.html#msg223710

Я так понял , что реальный возраст известен? и такие сильные расхождения ?
Есть варианты, почему ?

Оффлайн Ринат

  • Сообщений: 2573
  • Страна: ru
  • Рейтинг +417/-6
  • I1 M227
Исключил Все равно получается почти 6 тыс лет  Почему ?
4) Калькулятор очень чувствителен к многошаговым мутациям и реклохам.
http://forum.molgen.org/index.php/topic,6579.msg223688.html#msg223688

Для использования калькулятора, придется подучить некоторую матчасть.
Калькулятор использует метод кластеризации по матрице расстояний и естественно уступает филогенетическим программам, да и не ставилось такой цели. Основное назначение калькулятора - возможность быстро получить результат и прикинуть что к чему. На полученной вами схеме сразу видно несколько гаплотипов явно отброшенных программой. При их рассмотрении мы видим у двоих из них сильно отличающееся от других значение dys447, они и увеличили возраст всего дерева. Далее мы видим реклох в dys464 - значит надо исключить этот маркер из расчетов, так как он искажает конечную картину и расчет. Еще на этой выборке можно удалить CDY.
В алгоритмах построения дерева, основанных на character-based методе такие проблемы можно обойти, но это соответственно требует больших ресурсов от сервера, что я не могу позволить по очевидным причинам.

Как заключение: пробуйте, анализируйте, изучайте. Особенно обратите внимание на стабильные группы гаплотипов, на структуру которых не влияет изменение количества и состава выборки - их уже можно выделять в небольшие кластеры.
Да , спасибо большое . Я это все уже ранее сделал . Просчитал расположении гаплотипов на древе , без учета DYS 459a b , 464 abcdef ,  CDYa b .  Единственно не учел DYS 447 . Хотел с помощью вашей программы , уточнить возраста каждого гаплотипа , до общих предков . Это остается для меня загадкой .

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 6009
  • Страна: ru
  • Рейтинг +4220/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
Исключил Все равно получается почти 6 тыс лет  Почему ?
4) Калькулятор очень чувствителен к многошаговым мутациям и реклохам.
http://forum.molgen.org/index.php/topic,6579.msg223688.html#msg223688

Для использования калькулятора, придется подучить некоторую матчасть.
Калькулятор использует метод кластеризации по матрице расстояний и естественно уступает филогенетическим программам, да и не ставилось такой цели. Основное назначение калькулятора - возможность быстро получить результат и прикинуть что к чему. На полученной вами схеме сразу видно несколько гаплотипов явно отброшенных программой. При их рассмотрении мы видим у двоих из них сильно отличающееся от других значение dys447, они и увеличили возраст всего дерева. Далее мы видим реклох в dys464 - значит надо исключить этот маркер из расчетов, так как он искажает конечную картину и расчет. Еще на этой выборке можно удалить CDY.
В алгоритмах построения дерева, основанных на character-based методе такие проблемы можно обойти, но это соответственно требует больших ресурсов от сервера, что я не могу позволить по очевидным причинам.

Как заключение: пробуйте, анализируйте, изучайте. Особенно обратите внимание на стабильные группы гаплотипов, на структуру которых не влияет изменение количества и состава выборки - их уже можно выделять в небольшие кластеры.
Да , спасибо большое . Я это все уже ранее сделал . Просчитал расположении гаплотипов на древе , без учета DYS 459a b , 464 abcdef ,  CDYa b .  Единственно не учел DYS 447 . Хотел с помощью вашей программы , уточнить возраста каждого гаплотипа , до общих предков . Это остается для меня загадкой .
Если вы сделали как я сказал, то получите возраст всей ветви 2994, но похоже что ветка постарше будет.

Оффлайн Аббат Бузони

  • ...
  • Сообщений: 19888
  • Страна: ru
  • Рейтинг +1818/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!
И это наглядная агитация к увеличению числа маркеров  ;D

100 пудов  ;D
Аббат Бузони, по ссылке
http://forum.molgen.org/index.php/topic,6579.msg223710.html#msg223710

Я так понял , что реальный возраст известен? и такие сильные расхождения ?
Есть варианты, почему ?

Возраст известен для первого узла и равен 159. Все вопросы Володе, не мое детище. Мне важнее то кто подтягивается на дереве ко мне ближе всего.

Оффлайн SemarglАвтор темы

  • "El sueño de la razón produce monstruos" ©
  • Сообщений: 6009
  • Страна: ru
  • Рейтинг +4220/-5
  • www.semargl.me
    • www.semargl.me
  • Y-ДНК: R1a [CTS3402+]
  • мтДНК: U4a2g
И это наглядная агитация к увеличению числа маркеров  ;D

100 пудов  ;D
Аббат Бузони, по ссылке
http://forum.molgen.org/index.php/topic,6579.msg223710.html#msg223710

Я так понял , что реальный возраст известен? и такие сильные расхождения ?
Есть варианты, почему ?

Возраст известен для первого узла и равен 159. Все вопросы Володе, не мое детище. Мне важнее то кто подтягивается на дереве ко мне ближе всего.
Ответ простой - гентическое расстояние 3 на 67. Статистически это обычно больше 150 лет, но бывает и такое, как две мутации на 67-ми маркерах между родными братьями.
http://forum.molgen.org/index.php/topic,5445.msg222434.html#msg222434


Оффлайн jonytamal

  • Сообщений: 166
  • Страна: ru
  • Рейтинг +26/-0
  • FTDNA: 230222 YSearch: NGEYB
  • Y-ДНК: R-Y2915* BigY - YF10663
  • мтДНК: H11a, МЖ - T2c1
Большое спасибо за калькулятор! Присоединяю свой плюс!
Попытал свои силы  :). Результат вот здесь. http://forum.molgen.org/index.php/topic,1258.msg224588.html#msg224588
В обоих случаях вставлял  20 гаплотипов, но калькулятор отбросил по одному: на 111 маркерах N64337, на 67 маркерах 257756. Хоть оба от меня достаточно далеки, но хотелось бы понять, в чем причина.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.