• Добро пожаловать, Гость
news Новости: Компания Gentis: ДНК-генеалогические тесты (Y-ДНК, мт-ДНК). История вашего Рода, записанная в ДНК.
news

Автор Тема: Haplogroup Classifier  (Прочитано 260 раз)

0 Пользователей и 1 Гость смотрят эту тему.

OnlineCenturion

  • Администратор
  • *****
  • Rating 161
  • Сообщений: 4377
  • Джедаи - хранители мира в Галактике.
    • WWW
Haplogroup Classifier
« : 21 Января 2010, 22:53:29 »
  •  
Machine-Learning Approaches for Classifying Haplogroup from Y Chromosome STR Data

Schlecht et al

http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.1000093
http://www.ploscompbiol.org/article/fetchObjectAttachment.action;jsessionid=4FDC3BF218DE8E8ECCE75A429C2DEFED?uri=info%3Adoi%2F10.1371%2Fjournal.pcbi.1000093&representation=PDF

This work is licensed under  Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License.

To download the software binary and instructions for LINUX (RedHat and source)

Executable Source - http://bcf.arl.arizona.edu/images/haplo/haplo-plos.tar.gz
Source code - http://bcf.arl.arizona.edu/images/haplo/haplo-plos-src.tar.gz

Записан
«Чтобы знать, куда мы идем, необходимо понять, кто мы; чтобы понять кто мы, необходимо знать, откуда мы родом».

... Пётр → Никита (1666) → Иван (1698) → Иван (1742) → Андрей (1773) → Фирс (1801) → Николай (1823) → Михаил (1868) → Илья (1890) → Василий → Сергей → Я

Минздрав предупреждает. Чтение "Вестника АКадемии" опасно для вашего здоровья.

OfflineОвод

  • Главный модератор
  • *****
  • Rating 200
  • Сообщений: 1356
  • Y-ДНК: R1a1
  • мтДНК: U4a
Re: Haplogroup Classifier
« Reply #1 : 22 Января 2010, 01:55:05 »
  •  
Очень интересная работа. Поясню отличие предиктора, разработанного авторами от ныне известных:
 
Наиболее популярна группа предикторов, основанная на формуле Байеса. Она классифицирует гаплотипы на некоторое количество гаплогрупп и их субкладов. Это количество строго задано, причем тот факт, что гаплогруппы и субклады ветвятся в этой формуле никак не учитывается. Знаменитый Аттеевский предиктор - именно таков.
 
Другой подход - учёт ветвления гаплогрупп, типа - классификации по дереву. Он считается более структурным, нежели чисто статистический и может вести классификацию "по уровням". Но используется реже ввиду своей сложности и необходимости обучения по всей структуре дерева гаплогрупп, а не по их фиксированному набору, что сделать проще.
 
Так вот: подход авторов - попытка "скрестить ужа и ежа". Они одновременно используют и Байесовский подход и дерево. Продвигаются они по дереву используя понятие "энтропии гаплотипов" по отношению к ветвлению гаплогрупп, а не примеряя гаплотип к каждой из исследуемых гаплогрупп, которых у них может быть сколько угодно.
 
Я не скажу навскидку, насколько такой подход может быть успешен практически, но идея интересная. К сожалению, сам предиктор написан для Линукса, которого у меня нет. Но тем, кто им располагает, я очень рекомендую его испытать и сравнить, скажем, с Аттеем, для уже проснипованных гаплотипов.
 
Очень интересно, в чью пользу будет сравнение.
 
« Последнее редактирование: 22 Января 2010, 02:01:17 от Овод »
Записан
 

Rambler's Top100