АвторТема: Как определить гаплогруппу по гаплотипу?  (Прочитано 1012 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн emaevskiyАвтор темы

  • Сообщений: 7
  • Страна: ru
  • Рейтинг +0/-0
Уважаемые гуру!
Просмотрел много материала из серии "ДНК-генеалогия для любителей", но нигде не нашел ответа на казалось бы логичный и внешне простой вопрос. Как определить гаплогруппу по гаплотипу? Т.е. в каких-то конкретных случаях - я видел ответы знающих людей. А вообще? Алгоритм?
« Последнее редактирование: 04 Июнь 2018, 19:55:35 от Lesla »

Оффлайн Lesla

  • Главный модератор
  • *****
  • Сообщений: 8528
  • Страна: ru
  • Рейтинг +1962/-9
  • FTDNA: 154400 (Big Y - 283049)
  • Y-ДНК: R1a-YP682 (VK01/VK03+)
Уважаемые гуру!
Просмотрел много материала из серии "ДНК-генеалогия для дебилов", но нигде не нашел ответа на казалось бы логичный и внешне простой вопрос. Как определить гаплогруппу по гаплотипу? Т.е. в каких-то конкретных случаях - я видел ответы знающих людей. А вообще? Алгоритм?
Если Вы лично хотите научится, то собирайте статистику зависимости значений тех или иных маркеров у разных гаплогрупп. Постепенно придет опыт.
Если доверяете спецам, то пользуйтесь предиктором - http://www.nevgen.org/

Оффлайн emaevskiyАвтор темы

  • Сообщений: 7
  • Страна: ru
  • Рейтинг +0/-0
собирайте статистику зависимости значений тех или иных маркеров у разных гаплогрупп
А эта статистика где-то опубликована? Или ее надо в прямом смысле слова "собирать", надергивая по веб (и не веб) страницам?

Оффлайн Lesla

  • Главный модератор
  • *****
  • Сообщений: 8528
  • Страна: ru
  • Рейтинг +1962/-9
  • FTDNA: 154400 (Big Y - 283049)
  • Y-ДНК: R1a-YP682 (VK01/VK03+)
собирайте статистику зависимости значений тех или иных маркеров у разных гаплогрупп
А эта статистика где-то опубликована? Или ее надо в прямом смысле слова "собирать", надергивая по веб (и не веб) страницам?
Естественно в прямом. Вы же не ищите легких путей (предиктор). Все самостоятельно. Пытливому уму чужие наработки ни к чему.

Оффлайн emaevskiyАвтор темы

  • Сообщений: 7
  • Страна: ru
  • Рейтинг +0/-0
Нет, все равно непонятно. Это каков же должен быть объем статистического материала (выборки)? Если есть (допустим) 37 маркеров и по каждому (пусть для простоты) 2 наиболее распространенных значения, так это же получается 2^37 гаплотипов. Разве реально такое удержать в голове или "надергать" откуда-то?

Ладно, давайте зайдем с другой стороны. Гаплогруппа ведь определяется по снипам, да? А между гаплотипом и снипами нет (неизвестно) четкой взаимосвязи? Значит эти предикторы - это просто нейронные сети, обученные на каких-то выборках. Бывает ведь, что различные предикторы дают  различные предсказания? Тогда получается надо пользоваться тем предиктором, который обучен на наиболее обширной и разнообразной выборке.

Вопрос изначально был вот в чем. У любого из здешних уважаемых специалистов в голове есть свой собственный предиктор, алгоритм, по которому этот специалист, увидев гаплотип, говорит фразу типа: "у вас, очевидно, гаплогруппа AAA". Вот об этих алгоритмах я и спрашивал. Или это ноу-хау, которым не делятся?

Оффлайн Oleg V.

  • Сообщений: 700
  • Страна: ru
  • Рейтинг +133/-0
  • Y-ДНК: R1a-Z92>YP569
  • мтДНК: ?
Люди, как правило, уже много насмотрелись гаплотипов разных субкладов (с проверенными снипами) и по маркерам видят, к кому из изученных ранее близок текущий образец.

Оффлайн emaevskiyАвтор темы

  • Сообщений: 7
  • Страна: ru
  • Рейтинг +0/-0
и по маркерам видят
Спасибо, но это не добавляет понимания.

Оффлайн Lesla

  • Главный модератор
  • *****
  • Сообщений: 8528
  • Страна: ru
  • Рейтинг +1962/-9
  • FTDNA: 154400 (Big Y - 283049)
  • Y-ДНК: R1a-YP682 (VK01/VK03+)
и по маркерам видят
Спасибо, но это не добавляет понимания.
Понимание приходит с опытом. Опыт приходит после просмотра энного количества гаплотипов. Возвращаемся к изначальной идеи: самостоятельный сбор гаплотипов и их статистический анализ.

Оффлайн ankr21

  • Сообщений: 2076
  • Страна: ru
  • Рейтинг +420/-0
  • Y-ДНК: I1-L1302
  • мтДНК: U3b1b
Нет, все равно непонятно. Это каков же должен быть объем статистического материала (выборки)? Если есть (допустим) 37 маркеров и по каждому (пусть для простоты) 2 наиболее распространенных значения, так это же получается 2^37 гаплотипов. Разве реально такое удержать в голове или "надергать" откуда-то?

Ладно, давайте зайдем с другой стороны. Гаплогруппа ведь определяется по снипам, да? А между гаплотипом и снипами нет (неизвестно) четкой взаимосвязи? Значит эти предикторы - это просто нейронные сети, обученные на каких-то выборках. Бывает ведь, что различные предикторы дают  различные предсказания? Тогда получается надо пользоваться тем предиктором, который обучен на наиболее обширной и разнообразной выборке.

Вопрос изначально был вот в чем. У любого из здешних уважаемых специалистов в голове есть свой собственный предиктор, алгоритм, по которому этот специалист, увидев гаплотип, говорит фразу типа: "у вас, очевидно, гаплогруппа AAA". Вот об этих алгоритмах я и спрашивал. Или это ноу-хау, которым не делятся?
нет никакого ноу-хау. Все предикторы и «головы спецов» по одному алгоритму работают. В исследуемом гаплотип находят характерны маркёры индикаторы, которые с большой вероятностью указывают на ту или иную гаплогруппу. Например возьмём мою родную гаплогруппу I1. У 98% носителей I1 dys455=8, в других гаплогрупах тоже может наблюдаться такое ж значение, но по одному маркёру не оценивают. Смотрим dys388 (=14 для 93% I1), dys437 (=16 для 95% I1) и т.д. Программа складывает эти вероятности с математической точностью, но специалист по той или иной гаплогруппе или ветке порой точней предсказывает. Он учитывает СТР маркеры-индикаторы, которые находит в гаплотипах своей хорошо изученной ветки, но которых ещё нет в общедоступных базах.
Ой, пардон. Пока рисовал ответ, в другую тему все перетащили.

Оффлайн Lesla

  • Главный модератор
  • *****
  • Сообщений: 8528
  • Страна: ru
  • Рейтинг +1962/-9
  • FTDNA: 154400 (Big Y - 283049)
  • Y-ДНК: R1a-YP682 (VK01/VK03+)
Он учитывает СТР маркеры-индикаторы, которые находит в гаплотипах своей хорошо изученной ветки, но которых ещё нет в общедоступных базах.
Звучит как "теория заговора" )))
Сейчас последуют замечания, типа: "ага, я так и знал, что есть какие-то секреты, которые специалисты прячут!"

Оффлайн Farroukh

  • Maternal Y-DNA: R1b-L584
  • ...
  • Сообщений: 10244
  • Страна: az
  • Рейтинг +1430/-15
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37093
  • мтДНК: F2f
Цитировать
есть свой собственный предиктор, алгоритм, по которому этот специалист, увидев гаплотип, говорит фразу типа: "у вас, очевидно, гаплогруппа AAA". Вот об этих алгоритмах я и спрашивал.
Речь о характерных аллелях. В каждом субкладе они могут быть свои.

Оффлайн ankr21

  • Сообщений: 2076
  • Страна: ru
  • Рейтинг +420/-0
  • Y-ДНК: I1-L1302
  • мтДНК: U3b1b
Он учитывает СТР маркеры-индикаторы, которые находит в гаплотипах своей хорошо изученной ветки, но которых ещё нет в общедоступных базах.
Звучит как "теория заговора" )))
Сейчас последуют замечания, типа: "ага, я так и знал, что есть какие-то секреты, которые специалисты прячут!"
Просто в гаплогрупных проектах могут быть непубличный гаплотипы. Участники и админы их видят, а остальные нет. Вот в нашей ветке I-z73 админы практически безошибочно предсказывают ветку по 67 или 111 маркёрам. И это подтверждается результатами бигУ впоследствии.

Оффлайн Lesla

  • Главный модератор
  • *****
  • Сообщений: 8528
  • Страна: ru
  • Рейтинг +1962/-9
  • FTDNA: 154400 (Big Y - 283049)
  • Y-ДНК: R1a-YP682 (VK01/VK03+)
Просто в гаплогрупных проектах могут быть непубличный гаплотипы. Участники и админы их видят, а остальные нет. Вот в нашей ветке I-z73 админы практически безошибочно предсказывают ветку по 67 или 111 маркёрам. И это подтверждается результатами бигУ впоследствии.
Одно дело непубличные гаплотипы. Другое, маркеры из нестандартной линейки.
И дело не в том, что админы могут помочь в сложных ситуациях, а о том, как самостоятельно научится по гаплотипам гаплогруппу предсказывать. Админы же не волшебники, тоже как-то учились.

Оффлайн ankr21

  • Сообщений: 2076
  • Страна: ru
  • Рейтинг +420/-0
  • Y-ДНК: I1-L1302
  • мтДНК: U3b1b
Просто в гаплогрупных проектах могут быть непубличный гаплотипы. Участники и админы их видят, а остальные нет. Вот в нашей ветке I-z73 админы практически безошибочно предсказывают ветку по 67 или 111 маркёрам. И это подтверждается результатами бигУ впоследствии.
Одно дело непубличные гаплотипы. Другое, маркеры из нестандартной линейки.
И дело не в том, что админы могут помочь в сложных ситуациях, а о том, как самостоятельно научится по гаплотипам гаплогруппу предсказывать. Админы же не волшебники, тоже как-то учились.
Если честно, никогда не пытался "навскидку" определять по гаплотипу гаплогруппу. Для этого придется вызубрить модальные значения для каждой гаплы хотя бы до 12 маркеров. Но какой в этом смысл? Предикторы, тот же nevgen, предсказывает гаплогруппу на уровне R1a, J1, I1 и т.д. с высокой точностью даже по 12 маркерам. У меня нет оснований не доверять этим утилитам. Если надо копнуть глубже, приходится залазить в проекты (без базы Semargl тяжко, надо признать) и выискивать характерные маркеры, которые отличают одну ветку от другой. Я редко берусь по гаплотипу определять ветку. Только для своей гаплы I1. Иногда, по гаплогруппам курируемых – R1a и N1c. Опять же, участники проектов видят больше гаплотипов, чем наблюдатель со стороны.
« Последнее редактирование: 04 Июнь 2018, 12:07:15 от ankr21 »

Оффлайн emaevskiyАвтор темы

  • Сообщений: 7
  • Страна: ru
  • Рейтинг +0/-0
Интересно читать вашу дискуссию, уважаемые мэтры:)
А можно попросить в студию, раз уж речь зашла, список основных ресурсов: предикторов, баз и прочего необходимого. Поскольку это вполне соответствует теме. Т.е. алгоритм определения гаплогруппы состоит в следующем: (1) лезем на сайты-предикторы, смотрим предсказания; (2) ищем по базам людей со сходным гаплотипом; (3) спрашиваем совета у мэтров; и т.д.... Вот примерно в таком стиле можно попросить подытожить?

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100