FAQ (часто задаваемые вопросы) по аутосомным этно-калькуляторам
В: Что такое аутосомные калькуляторы? Как они работают?
О: Аутосомные этно-калькуляторы предназначены для определения происхождения тестируемого на основании анализа его генома. Здесь возможны разные подходы. В этом FAQ разбирается лишь одна их разновидность - калькуляторы, действующие на основании анализа статистических закономерностей распределения снипов в разных популяциях.
В: Где можно воспользоваться этими калькуляторами?
О: Проще всего закачать свой файл raw data на бесплатный сервис gedmatch.com, калькуляторы находятся там в разделе Admixture. Также многие калькуляторы доступны для самостоятельного запуска, ссылки на них собраны в теме
http://forum.molgen.org/index.php/topic,5736.msg188314.html#msg188314 . Компании, занимающиеся генотипированием, часто предоставляют клиентам свои версии этно-калькуляторов, более или менее удачные. Кроме этого, существуют проекты геномных блоггеров (однако большинство из них прекратили прием новых участников), а также ряд сайтов, занимающихся анализом загружаемой raw data - часть из них делает это за плату.
В: Я запустил калькулятор на Gedmatch, он показал мне, что я на 30% восточный европеец, на 40% западный, на 15% средиземноморец. Что все это означает?
О: Это так называемые предковые компоненты. Они очень древние, по большей части идут еще из каменного века. Названия даются условно, обычно по районам, где компонент наиболее распространен. Слегка упрощая, можно сказать, что у большинства европейцев наследственность сложена из одних и тех же компонентов, разница в их соотношении между собой.
В: Почему, к примеру, в одном калькуляторе у меня 16% Кавказа, а в другом всего 5%? Неужели погрешность настолько велика?
О: В разных калькуляторах компоненты выделяются несколько по-разному и обозначают разные вещи. Поэтому напрямую сравнивать их нельзя, даже если название совпадает. Некоторые калькуляторы сделаны в виде серий с постепенно увеличивающимся количеством компонентов (оно обозначается буквой K). При маленьком количестве компонентов показывается общая картина, затем, при увеличении K, изначальные компоненты расщепляются на более мелкие и детальные. При этом название у некоторых может сохраниться.
В: А как определить более свежее происхождение, не на тысячелетия назад?
О: Сравнивая свои результаты с результатами других людей. Чем более они похожи, тем ближе вы к народу, из которого происходят эти люди. Для упрощения процесса созданы специальные инструменты под названием "Оракулы". В них собраны наиболее типичные результаты для разных популяций (народов), эти результаты сравниваются с вашими и показываются наиболее близкие варианты. На Gedmatch оракулы запускаются кнопками Oracle, Oracle-4, Oracle-X в нижней левой части окошка, где показывают ваши результаты по предковым компонентам. Расстояние указано в правой колонке, обычно хорошим приближением считается в пределах 5.
В: Что, если у меня предки происходят из разных местностей? Как их выделить?
О: Оракулы приводят возможные комбинации предков, которые могли дать результат, близкий к вашему. Обратите внимание, что к одному и тому же результату можно прийти разными путями, здесь приводится лишь список наиболее вероятных вариантов.
В: Какие калькуляторы лучше всего подойдут восточноевропейцам?
О: Наилучшую детализацию для восточноевропейцев дают проекты MDLP и Eurogenes. Оптимально попробовать все калькуляторы и сравнить их между собой.
В: Что такое Oracle-4, Oracle-X?
О: Оракул четырех предков пытается подобрать наиболее близкие к вам сочетания сначала двух предков (папа+мама), затем трех (например, папа + дедушка и бабушка по маме), затем четырех (два дедушки и две бабушки). Oracle-X пытается разложить вашу наследственность на неопределенное число предков, это не оракул для X-хромосомы, как часто думают.
В: Результаты оракула слишком далеки от моего настоящего происхождения.
О: К сожалению, многие оракулы страдают от искажения результатов, этот эффект будет описан мной в отдельной заметке. Если подходить к делу практически, можно порекомендовать использовать оракул Eurogenes JTest/EUtest для людей, у которых ожидаемые предки происходят из близких популяций, и MDLP World-22 для людей сильно смешанного происхождения. EUtest V2 тоже может дать хороший результат, но у многих людей в этом калькуляторе слишком большое отклонение.
Возможная причина эффектаВ: Почему оракул выдает такие странные сочетания? Мои предки из-под Ярославля, а он показывает Эстонию+Север, или Эстонию+Поволжье.
О: У оракула в списке эталонов нет русских Ярославля, поэтому он ищет наиболее близкое к ним сочетание. С его точки зрения, это что-то среднее между Эстонией и Поволжьем или Эстонией и Севером. Географически Ярославль подходит сюда совсем неплохо. Такой результат вовсе не означает, что среди ваших предков обязаны быть эстонцы или кто-то еще из перечисленных.
В: По семейной легенде, среди моих предков были евреи-ашкенази. Можно это как-то определить?
О: Хорошие результаты в этом смысле дает калькулятор Ancestry Composition компании 23andMe. Однако самый лучший метод - анализ количества совпаденцев (людей, с которыми у вас есть длинные общие сегменты на хромосомах), оно должно быть в разы выше типичных значений. В большинстве аутосомных калькуляторов ашкенази очень близки к грекам и южным итальянцам, разделить их сложно.
В: По семейной легенде, среди моих предков были цыгане. Что может свидетельствовать в эту пользу, наличие компонента Индия/Южная Азия?
О: Цыгане действительно имеют заметные количества этого компонента. Однако его наличие у русских обычно объясняется другими причинами. Во-первых, фоновое распространение среди русских в районе 0-2% (в зависимости от калькулятора). Во-вторых, этот компонент часто встречается у народов Поволжья, и далее его процент растет по направлению к Средней Азии и Индии.
В: Моя бабушка была похожа на грузинку, а калькулятор ничего подобного не показывает. Как такое может быть?
О: Внешность очень обманчива. Как говорят знатоки антропологии, судить о происхождении отдельного человека на основании его внешности нельзя. Впрочем, народное мнение здесь непоколебимо.
В: Калькулятор нашел у меня около 1% Меланезии. Неужели среди моих предков были папуасы?
О: Видимо, это издержки вероятностного подхода. На небольшие отклонения в районе 1% можете смело не обращать внимания.
В: Говорят, эти калькуляторы основаны на небольших любительских коммерческих выборках, русских там представляют чуваши, а словаков евреи.
О: Современные калькуляторы основаны на большом количестве научных выборок (сотни популяций, тысячи человек). Непредставительные результаты исключаются.
В: Все равно, разве можно делать выводы по таким маленьким выборкам?
О: Если выборка сделана правильно, то достаточно сравнительно небольшого размера. Научные выборки хорошо представляют разнообразие населения Земли. Конечно, если добавить дополнительные данные, это поможет уточнению деталей, но радикальных изменений результата не произойдет.