АвторТема: DNA tribes - этно-популяционный анализ  (Прочитано 59676 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: DNA tribes - этно-популяционный анализ
« Ответ #165 : 29 Июнь 2013, 23:01:25 »
Единственное, что я действительно знал до теста 23andme, что бабушка у меня из Белоруссии, но то, что я, согласно этно-анализу, генетически окажусь ближе всего именно к белорусам, явилось для меня новостью, и только после упорных расспросов оказалось, что и большая часть предков моего деда именно оттуда, причем из той же области, что и бабушка.  Но дедов у меня не только два, и на четверть я немец, вот только никаких типичных соотношений компонентов, ассоциирующихся с немцами (конкретно с потомками германцев) у меня не обнаружилось, зато появились указания на влияния неких ФУ - всего этого я не знал

Теперь рассмотрим этот этап.

Так понял, предварительных генеалогических изысканий Вы не сделали?
Конечно, понимаю, что вряд ли кто, или мало кто способен как я довести своё генеалогическое до 41000 (сорока одной тысячи) персоналий. Но хотя бы добраться до прабабушек-прадедушек - под силу любому.
Ну, да ладно.

Остановимся только на том, что на уровне дедов-бабушек Вы полкуровка.

Вернусь к аналогии с красками. Если в одно ведро слить белую и чёрную краску, а потом слегка смешать - результат получается самый непредсказуемый.
Основываюсь, естественно, на личном опыте. Данные мои, матери, отца, сестры - это четыре разные песни.
То же самое у тёщи, жены, шурина, сестры жены.

Резюмирую: в Вашем конкретно случае этно-анализ по снипам будет особо непредсказуемым и заслуживающим наименьшего доверия.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: DNA tribes - этно-популяционный анализ
« Ответ #166 : 29 Июнь 2013, 23:11:19 »
О выборе инструментария.


Зачастую лучше и понятнее этно плотов обычная стат обработка.
Т.е., возьмите те же данные от АнцестриФайндера и меняя количество предков из одного и того же региона с 4 до 1, а также варьируя размеры УПСа, посмотрите, какие страны у Вас будут в максимумах.
Ведь в отличии от научных выборок, тут всё базируется на в общем-то известном регионе происхождения бабушек-дедушек.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: DNA tribes - этно-популяционный анализ
« Ответ #167 : 29 Июнь 2013, 23:18:51 »
О гомогенности этносов.
Разве немец - это что-то незыблемое?
Разве житель Гамбурга - это тоже самое, что и уроженец Баварии?
Может немец быть из Пруссии, а то и просто онемеченный поляк.
То есть опять возращаемся к тщательности, с которой сделана та, или иная научная (этим термином обозначаю некоммерческие) выборка.

Опять-таки из личного опыта: этно-профили коренных жителей всего одного села (ныне в нём живёт около 500-700 человек), причём все тестируемые старше 1950 г.р. и генеалогии сведены по всем ветвям до начала 18 века - не совпадают.
Понимаете?
Крохотная популяция - огромный разброс значений.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: DNA tribes - этно-популяционный анализ
« Ответ #168 : 29 Июнь 2013, 23:25:02 »
Теперь о сетованиях на то, что предикты не очень релевантны (Санька свалил, можно не стесняться с употреблением мудрёных словечек :) ).

Имееем две стороны:

1. Надёжность самого метода. (Тут претензий нет. Все способы опробованы и теоретически выверены.)

2. Размеры и надёжность сравнительной базы. (Если таковая ненадёжна, или отсутствует, то хоть на голове пляши - надёжных результатов не получишь. Остаётся только ждать.)

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: DNA tribes - этно-популяционный анализ
« Ответ #169 : 29 Июнь 2013, 23:36:35 »
Задумался насчет заказа СТР-теста, но, поизучав их сайт, убедился, что точность его ниже, чем у лучших снип-тестов. Причины, как мне кажется, следующие:
1) Примерно один маркер на хромосому - это маловато. В хорошем снип-анализе используются тысячи снипов на каждой хромосоме. Для идентификации личности человека этих стр-маркеров достаточно, но не для углубленного этно-анализа.

Не правильно.
Вернее, правильно но в перспективе.
Во-первых, тот же тест по аутосмным снипам у Анцестри.ком; тест, который позиционирует себя, как наилучший на сегодня, использует всего 372 снипа.
Во-вторых, если учесть, что гипотетически однонуклеотидные снипы имеют, минимум, пять значений (на практике много больше), в большинстве случаев имеем только бинарные значения. Скажем, Т вместо обычного А.
А по коротким повторам (СТРам, стало быть) варианты значений для одного маркера могут превышать пару десятков. К примеру, разброс значений от 7 до 33.
В-третьих, опять про сравнительную базу. Если по СТРам - это большей частью работа профильных специалистов, то немногое, что есть по снипам сегодня во многом базируется на любительских подборках из коммерческих выброк.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: DNA tribes - этно-популяционный анализ
« Ответ #170 : 29 Июнь 2013, 23:40:28 »
2) Слишком простой алгоритм, вычисляется только абсолютная близость к популяциям. Это годится только в случае, когда близость к какой-либо популяции очень высока. В противном случае более хорошие результаты дает, к примеру "Оракул четырех предков" (для снип-тестов).
Алгоритмы схожи.
Просто по СТРам напирают на числовое представление.
В то время как по снипам большей частью используется представление графическое.

Если рассматривать только числовые варианты, то особой разницы нет.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: DNA tribes - этно-популяционный анализ
« Ответ #171 : 29 Июнь 2013, 23:55:23 »
Тем не менее, на уровне континентов тест вполне работает.

Тест работает на уровне популяций. На сегодня их там 1273.

Вот что, например, есть по белорусам:

Baranovichi, Belarus (80)
Belarus (2,020)
Belarus (2,020)
Belarus (932)
Belarus (2,196)
Belarus (96)
Gorodok, Belarus (63)
Ivanovo, Belarus (84)
Klimovichi, Belarus (81)
Krupki, Belarus (81)
Mjadel, Belarus (77)
Molodecheno, Belarus (69)
Pinsk, Belarus (89)
Polotsk, Belarus (49)
Smorgon, Belarus (68)
Svetlogorsk, Belarus (89)


В скобках указаны размеры выборок.

Оффлайн Asmat headhunter

  • Биохимическая субстанция
  • Сообщений: 12395
  • Страна: id
  • Рейтинг +814/-34
  • И того казака те тунгусы пальмами тут искололи
Re: DNA tribes - этно-популяционный анализ
« Ответ #172 : 29 Июнь 2013, 23:55:42 »
О гомогенности этносов.
Разве немец - это что-то незыблемое?
Разве житель Гамбурга - это тоже самое, что и уроженец Баварии?
Может немец быть из Пруссии, а то и просто онемеченный поляк.
То есть опять возращаемся к тщательности, с которой сделана та, или иная научная (этим термином обозначаю некоммерческие) выборка.

Опять-таки из личного опыта: этно-профили коренных жителей всего одного села (ныне в нём живёт около 500-700 человек), причём все тестируемые старше 1950 г.р. и генеалогии сведены по всем ветвям до начала 18 века - не совпадают.
Понимаете?
Крохотная популяция - огромный разброс значений.

И что тогда делать с выборками? :-\

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: DNA tribes - этно-популяционный анализ
« Ответ #173 : 30 Июнь 2013, 00:00:58 »
Ну, и последнее.
По поводу того, что тест по СТРам у ДНАтрайбз вроде проигрывает этно-тестам по снипам.
Мог бы в качестве примера привести свои многочисленные данные по СТРам, которые пока (ещё раз подчеркиваю это пока, так как будущее за тестами по снипам) гораздо более убедительны тестов по снипам (их я, естественно, тоже все сделал).

Оффлайн Srkz

  • Сообщений: 6838
  • Страна: ru
  • Рейтинг +3621/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1e-pre T16093C T16311T
Re: DNA tribes - этно-популяционный анализ
« Ответ #174 : 03 Июль 2013, 08:57:24 »
Сравнение снп-теста DNA Tribes и MDLP World-22 Вадима Веренича.

С подачи FenriR я проработал таблицу эталонных популяций 20-компонентного снп-этнокалькулятора DNA Tribes. Структурно он довольно схож с World-22 Вадима Веренича, поэтому логично провести их сравнение.
Европа у Вадима (и в большинстве других калькуляторов) разделяется на два основных полюса - Литва (Северо-Восточная Европа) и Сардиния/баски (Атлантика-Средиземноморье). В ДНА Трайбс выделены эти же два компонента как Славик-Балтик и Медитерранеан. Кроме этого, они постарались выделить еще один компонент - Северо-Западную Европу с пиком в Ирландии и на Оркнейских островах. Логично, если они хотят увеличить детализацию теста для людей преимущественно британского происхождения. Компонент получился композитным, на Западе он заменяет в первую очередь Славик-Балтик, на Востоке - Медитерранеан. Поэтому распространение Славик-Балтик среди славян близко к Северо-Восточной Европе World-22 (с поправкой, о которой в разделе про Уралик), среди германских же и романских народов он падает гораздо резче. Аналогично Медитерранеан доминирует на юго-западе Европы - в абсолютных значениях сильнее, чем у Вадима, но быстрее спадает при удалении.
Мне кажется, основные европейские кластеры сделаны резче, чем они на самом деле, это загрубляет результаты. Но в целом распределение по ним выглядит верным.
Следующий компонент - Уралик. Здесь попытались объединить финнов и чувашей, что, на мой взгляд, неверно для Восточной Европы. Оба этих народа очень своеобразны. Видимо, действовали по аналогии с объединением сардинцев и басков и хотели вывести аналогичной кластер для противоположного конца Европы. Что-то в этой идее есть, но финнов тяжело с кем-то объединить.
В результате в состав компонента вошли Мезолитическая Северная Европа из World-22 (финский, в более широком смысле общий северо-европейский компонент), Самоедик (уральский-западносибирский компонент), и отщипнули хороший кусок от Балто-Славика. Здесь калькулятор Вадима выглядит гораздо детальнее и точнее.
Далее идет "сибирский" адмикс, который у Вадима Веренича тонким слоем размазан по северо-востоку Европы. У ДНА Трайбс он частью тоже ушел в Уралик, частично виден у северных русских и очень сильно представлен у чувашей (на мой взгляд, слишком сильно).
Важный европейский компонент - Кавказ/Западная Азия. В World-22 он распространен по всей Европе в сравнительно небольших количествах. Считается, что это след первых земледельцев из Малой Азии, в свое время распространившихся по Европе, но впоследствии вытесненных/ассимилированных. В ДНА Трайбс распространение Кавказа и Ближнего Востока (Месопотамиан) похоже на вариант Веренича, но тоже проявлено слабее - видимо, часть ушла в резкие европейские компоненты.

Резюмируя - каждый калькулятор нацелен на свою аудиторию. Если DNA Tribes в первую очередь концентрируются на Западной Европе, то проект Вадима Веренича дает заметно лучшую детализацию по Европе Восточной.
Судя по результатам FenriR (результаты других форумчан опубликованы до последнего изменения методики), уровень шума в DNA Tribes довольно велик - если Mesoamerican 3.0% Indus Valley 2.9% еще можно списать на Север, Сибирь и Поволжье, то West African 2.0% откровенный шум.

Оффлайн Srkz

  • Сообщений: 6838
  • Страна: ru
  • Рейтинг +3621/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1e-pre T16093C T16311T
Re: DNA tribes - этно-популяционный анализ
« Ответ #175 : 03 Июль 2013, 09:10:34 »
Интересная популяция что у Веренича, что в ДНА Трайбс - аляскинские алеуты. Похоже, генов с Русского Севера там больше, чем местных эскимосских.

Оффлайн Srkz

  • Сообщений: 6838
  • Страна: ru
  • Рейтинг +3621/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1e-pre T16093C T16311T
Re: DNA tribes - этно-популяционный анализ
« Ответ #176 : 03 Июль 2013, 09:35:00 »
А по коротким повторам (СТРам, стало быть) варианты значений для одного маркера могут превышать пару десятков. К примеру, разброс значений от 7 до 33.
Логично, я рассудил так же и полез на их сайт. Однако примеры результатов, приводимые на сайте, разочаровывают. Афро-американцы и индейцы для нас неактуальны, возьмем поляка. DNA Tribes® Europa, дата отчета стоит 27 июня 2013, совсем свежий.
Наиболее близкая популяция по основному индексу MLI - Юг России и Украины, причем с большим отрывом от остальных (17,839.06). Далее в порядке убывания:
Польша-Беларусь 11,405.98
Скандинавия 10,548.27
Центральная Россия и часть Украины 9,112.62
Северо-Запад Британии 8,363.74
Остальные европейские популяции примерно на одном уровне, чуть подальше. Индекс TribeScore для Польши чуть выше (0.85), чем для Юга России (0.83), но на том же уровне он и для Балкан, а самый высокий - в регионе Урал-Поволжье (0.96).
Я бы расшифровал так: Этот человек северный европеец, скорее всего славянин. Возможны скандинавские корни.
На мой взгляд это точность на уровне континентов.
Возможно, конечно, они просто привели неудачные примеры.
Цитировать
В-третьих, опять про сравнительную базу. Если по СТРам - это большей частью работа профильных специалистов, то немногое, что есть по снипам сегодня во многом базируется на любительских подборках из коммерческих выброк.
За последние годы по снипам набрано большое количество научных выборок, акцент смещается на них. Того же Вадима Веренича любителем не назовешь. Впрочем, этно-калькуляторы пока действительно находятся на начальной стадии развития, это такой момент, когда грамотный любитель может обогнать профессионалов.
Цитировать
Во-первых, тот же тест по аутосмным снипам у Анцестри.ком; тест, который позиционирует себя, как наилучший на сегодня, использует всего 372 снипа.
От коммерсантов другого позиционирования себя и не ожидается  :) Вот обзор СиСи Мур http://www.yourgeneticgenealogist.com/2012/12/comparing-admixture-test-results-across.html#comment-form, у нее Ancestry.com оказались в середине среди коммерческих тестов. Говоря о лучших тестах, я подразумевал проекты Веселовского и Веренича для восточноевропейцев.

По поводу размера выборок - здесь как в социологии. Если выборка сделана правильно, то достаточно определенного, не очень большого размера.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: DNA tribes - этно-популяционный анализ
« Ответ #177 : 03 Июль 2013, 12:16:56 »
Блин.
От бессилия хочется срываться на мат.
Но лучше всего просто отписаться от темы.
Пусть себе народ (не весь, а отдельные твёрдовыйные) спокойно себе глупствует. Или, как выражаются нынче, тупит.
На что, скажите, Вам сдался поляк? Когда в этой ветке есть полно примеров по форумчанам.

Моя первая пятнашка за далёкое 10 октября 2008 года.
Не очень внятно (но однако лучше, чем у Вашего поляка):

Extended Match Results
Michael Temosh
10/10/2008
DNA Tribes Genetic Ancestry Analysis

Rank Sample Name (TribeScore) MLI Score
1 Poland (0.99) 159,734.07
2 Pinsk, Belarus (0.99) 128,447.89
3 Andalusia, Spain (0.96) 117,083.85
4 Lodz, Poland (0.98) 106,641.81
5 Pomorze Zachodnie, Northwest Poland (0.98) 97,461.80
6 Dundee, Scotland (0.95) 95,582.72
7 Western Poland (0.98) 94,038.41
8 Lodz, Poland (0.98) 89,814.90
9 Estonia (0.98) 78,843.92
10 Northern Ireland (0.97) 77,399.58
11 Belarus (0.99) 75,180.95
12 Poland (0.98) 72,093.32
13 Central Poland (0.98) 66,178.36
14 Caucasian (0.97) 62,218.18
15 Southeast Poland (0.98) 59,769.76

Через пару лет сделал апгрейд, потому как прибавилось популяций. Картинка стала более реалистичной:

Extended Match Results
Michael Temosh
6/25/2010
DNA Tribes Genetic Ancestry Analysis

Rank Sample Name (TribeScore) MLI Score
1 Pskov, Russia (0.97) 3,335,300.88
2 Pinsk, Belarus (0.98) 1,374,005.65
3 Poland (0.94) 1,257,512.31
4 Finland (0.97) 933,063.70
5 Lodz, Poland (0.93) 884,767.25
6 Western Poland (0.93) 738,603.14
7 Croatia (0.92) 733,426.98
8 Pomorze Zachodnie, Northwest Poland (0.91) 718,144.61
9 Poland (0.92) 709,742.17
10 Belarus (0.94) 637,449.88
11 Lodz, Poland (0.92) 607,294.25
12 Central Poland (0.9) 600,686.39
13 Caucasian (U.S.A.) (0.92) 542,829.99
14 Northwest Spain (0.9) 530,307.52
15 Andalusia, Spain (0.88) 528,662.96

Уверен, что если сделать апгрейд сейчас, то и испанская грусть благополучно будет задвинута с 14 и 15 мест куда подальше.

Но уже не интересно (о причинах пространно поведал в предыдущих постах).

Закажите себе тест. Посмотрите. Сравните. А потом разочаровывайтесь.

*** От темы отписался.

Оффлайн Asmat headhunter

  • Биохимическая субстанция
  • Сообщений: 12395
  • Страна: id
  • Рейтинг +814/-34
  • И того казака те тунгусы пальмами тут искололи
Re: DNA tribes - этно-популяционный анализ
« Ответ #178 : 03 Июль 2013, 13:01:45 »
Интересная популяция что у Веренича, что в ДНА Трайбс - аляскинские алеуты. Похоже, генов с Русского Севера там больше, чем местных эскимосских.

Алеуты не эскимосы. Хотя и в одной эскимосско-алеутской языковой семье. Так можно и немцев славянами назвать. ;)

Оффлайн Srkz

  • Сообщений: 6838
  • Страна: ru
  • Рейтинг +3621/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1e-pre T16093C T16311T
Re: DNA tribes - этно-популяционный анализ
« Ответ #179 : 03 Июль 2013, 13:02:19 »
1 Pskov, Russia (0.97) 3,335,300.88
2 Pinsk, Belarus (0.98) 1,374,005.65
3 Poland (0.94) 1,257,512.31
4 Finland (0.97) 933,063.70
5 Lodz, Poland (0.93) 884,767.25
6 Western Poland (0.93) 738,603.14
7 Croatia (0.92) 733,426.98
8 Pomorze Zachodnie, Northwest Poland (0.91) 718,144.61
9 Poland (0.92) 709,742.17
10 Belarus (0.94) 637,449.88
Разве вы из Пскова? Хорошо, вероятно качество предиктов действительно еще выросло за последние три года. Это будет полезно для человека, все предки которого из одной и той же местности. Мои предки приезжали в Сибирь из разных мест, хотя теперь ясно, что больше всего с Севера и Волги. СТР-тест выдаст некое случайное среднее, взяв с каждой хромосомы по маленькому кусочку. Возможно, позже я его закажу, но пока жалко денег и времени.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.