АвторТема: Polako/Davidski Eurogenes plots  (Прочитано 214240 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн FenriR

  • Сообщений: 2074
  • Страна: 00
  • Рейтинг +552/-2
  • Y-ДНК: N1c1-L1025
  • мтДНК: K1a
Re: Polako/Davidski Eurogenes plots
« Ответ #1215 : 13 Октябрь 2015, 18:07:31 »
Похоже DW освоил Plotly (это хорошое средство для визуализации).

Вопрос - я уже много раз видел утверждения DW о том что в PCA из статьей древние геномы расположены неверно из-за projection bias (погрешность проекции вариативности древних геномов на вариативность современных геномов). Мне известен только один надежный метод уменьшение этой погрешности - прокрустова трансформация. Но я так помню что он критиковал этот классический подход. Какой метод использует сам Polako?

Видимо, как-то так:
http://eurogenes.blogspot.de/2014/05/pca-projection-bias-in-ancient-dna.html
Цитировать
PCA projection bias in ancient DNA studies
...
Here's a demonstration of this effect using two PCA. In the first PCA, La Brana-1, a Mesolithic genome from Iberia, was projected onto the PC eigenvectors computed with modern individuals from the HGDP. However, in the second PCA the ancient genome was run together with these samples. Note the clear difference between the two outcomes.
The second outcome does look a bit strange, but it's actually the correct one, because it's now an established fact that Mesolithic hunter-gatherers, like La Brana-1, were clearly outside the range of modern European, and indeed West Eurasian, genetic variation.
For a technical discussion of this problem, which is also sometimes known as "shrinkage", refer to Lee et al. 2012. To get an idea of the confusion that it can cause, see the discussion in the comments section under my last blog post:
...

Оффлайн I2a1a

  • ...
  • Сообщений: 10363
  • Страна: ee
  • Рейтинг +761/-8
Re: Polako/Davidski Eurogenes plots
« Ответ #1216 : 13 Октябрь 2015, 18:20:28 »
Это не доказательство, во-вторых это иллюстрация не "projection bias", а характерный пример присущего для PCA "cдвига" точек в центральный регион графика.
Очередной "эффект калькулятора"? Тем не менее, прокрустова трансформация доказала свою состоятельность в статистическом анализе, причем задолго до появления полных геномов.

Оффлайн I2a1a

  • ...
  • Сообщений: 10363
  • Страна: ee
  • Рейтинг +761/-8
Re: Polako/Davidski Eurogenes plots
« Ответ #1217 : 13 Октябрь 2015, 18:25:13 »
Сравните с моим графиком

https://plot.ly/324/~vadimverenich/

Оффлайн FenriR

  • Сообщений: 2074
  • Страна: 00
  • Рейтинг +552/-2
  • Y-ДНК: N1c1-L1025
  • мтДНК: K1a
Re: Polako/Davidski Eurogenes plots
« Ответ #1218 : 13 Октябрь 2015, 18:29:02 »
Это не доказательство, во-вторых это иллюстрация не "projection bias", а характерный пример присущего для PCA "cдвига" точек в центральный регион графика.
Очередной "эффект калькулятора"? Тем не менее, прокрустова трансформация доказала свою состоятельность в статистическом анализе, причем задолго до появления полных геномов.
он приводит это именно, как "projection bias" -  как говорится, "за что купил")

Оффлайн I2a1a

  • ...
  • Сообщений: 10363
  • Страна: ee
  • Рейтинг +761/-8
Re: Polako/Davidski Eurogenes plots
« Ответ #1219 : 13 Октябрь 2015, 18:30:09 »
Это не доказательство, во-вторых это иллюстрация не "projection bias", а характерный пример присущего для PCA "cдвига" точек в центральный регион графика.
Очередной "эффект калькулятора"? Тем не менее, прокрустова трансформация доказала свою состоятельность в статистическом анализе, причем задолго до появления полных геномов.
он приводит это именно, как "projection bias" -  как говорится, "за что купил")

Да понятно что это была цитата

Оффлайн FenriR

  • Сообщений: 2074
  • Страна: 00
  • Рейтинг +552/-2
  • Y-ДНК: N1c1-L1025
  • мтДНК: K1a
Re: Polako/Davidski Eurogenes plots
« Ответ #1220 : 13 Октябрь 2015, 18:37:04 »
Это не доказательство, во-вторых это иллюстрация не "projection bias", а характерный пример присущего для PCA "cдвига" точек в центральный регион графика.
Очередной "эффект калькулятора"? Тем не менее, прокрустова трансформация доказала свою состоятельность в статистическом анализе, причем задолго до появления полных геномов.
он приводит это именно, как "projection bias" -  как говорится, "за что купил")

Да понятно что это была цитата
я думаю, что у него там скорее "эмпирические" доказательства:
La-Brana1 стал вне границ изменчивости современных групп - значит метод более корректный
то же самое и относительно "эффекта калькулятора": люди, не включенные в расчет при работе над самим калькулятором, перестали заметно отличаться от "эталонных" представителей своих популяций - метод работает лучше.


Оффлайн I2a1a

  • ...
  • Сообщений: 10363
  • Страна: ee
  • Рейтинг +761/-8
Re: Polako/Davidski Eurogenes plots
« Ответ #1221 : 13 Октябрь 2015, 22:29:22 »
На MDS это нахождение вне границ изменчивости и так заметно

Оффлайн I2a1a

  • ...
  • Сообщений: 10363
  • Страна: ee
  • Рейтинг +761/-8
Re: Polako/Davidski Eurogenes plots
« Ответ #1222 : 13 Октябрь 2015, 23:08:21 »
Кстати, в MDS cдвиг не столько из-за того что палеогеномы вне границ современной изменчивости, а из-за гомозиготности (вернее в данном случае - гаплоидности). В MDS это лечится фильтрацией выборки по --hwe (она удаляет варианты нарушающие закон Харди-Вайнберга, а гаплоидные варианты его нарушают).


https://www.biostars.org/p/96673/

Оффлайн Mukovnikov

  • Сообщений: 1469
  • Страна: ru
  • Рейтинг +237/-6
  • Y-ДНК: N-Y4339>Y5611>F1983>S10880; мжм: N
  • мтДНК: K1c1e; мж - V13; ммж - J1c4b; мммж - H
Re: Polako/Davidski Eurogenes plots
« Ответ #1223 : 01 Декабрь 2015, 19:01:11 »
Мой Eurogenes K13:


Eurogenes K13 Oracle results:

Оффлайн Rompecabeza

  • Сообщений: 172
  • Страна: ru
  • Рейтинг +14/-0
  • Y-ДНК: NA
  • мтДНК: U5a1b1
Re: Polako/Davidski Eurogenes plots
« Ответ #1224 : 26 Апрель 2016, 00:05:57 »
Вот что выложил пользователь в группе на Фейсбуке, проживающий в Глазго или родом оттуда. Лично я делаю вывод о том, что калькулятор прекрасно работает с западными европейцами. EU V2K 15


Оффлайн andronn

  • 23andMe: Восточноевропейская 99,1 % финский 0,9 %. MyHeritage: Прибалт 42,1%, Восточноевропеец 36.7%,Балканец 20,3%, Финн 1,3%. Family Finder: East Slavic 45% West Slavic 28% Baltic 24% Greece & Balkan 2% Central Europe<2%
  • Сообщений: 590
  • Страна: ua
  • Рейтинг +185/-0
  • Y-ДНК: R-YP417
  • мтДНК: T2b4
Re: Polako/Davidski Eurogenes plots
« Ответ #1225 : 26 Апрель 2016, 17:31:14 »
Вот что выложил пользователь в группе на Фейсбуке, проживающий в Глазго или родом оттуда. Лично я делаю вывод о том, что калькулятор прекрасно работает с западными европейцами. EU V2K 15

У меня этот калькулятор выдает конкретно именно мою украинскую половину:
#       Primary Population (source)    Secondary Population (source)    Distance
1        75%   Ukrainian    +    25%   Erzya    @    3.04
2        76.5%   Ukrainian    +    23.5%   Kargopol_Russian    @    3.64
3        66.9%   Ukrainian_Lviv    +    33.1%   Erzya    @    3.73
4        78.9%   Ukrainian    +    21.1%   Lithuanian    @    3.82
5        68.5%   Ukrainian    +    31.5%   Southwest_Russian    @    3.86
6        76.2%   Ukrainian    +    23.8%   Estonian_Polish    @    3.99
7        74.2%   Ukrainian    +    25.8%   Ukrainian_Belgorod    @    4.02
8        94.2%   Ukrainian    +    5.8%   Chuvash    @    4.03
9        95.4%   Ukrainian    +    4.6%   Mari    @    4.06
10        79.4%   Ukrainian    +    20.6%   Belorussian    @    4.11
11        84.4%   Ukrainian    +    15.6%   Estonian    @    4.19
12        65.3%   Ukrainian_Lviv    +    34.7%   Kargopol_Russian    @    4.27
13        98.1%   Ukrainian    +    1.9%   MA-1    @    4.28
14        92.5%   Ukrainian    +    7.5%   East_Finnish    @    4.3
15        91.1%   Ukrainian    +    8.9%   Russian_Smolensk    @    4.35
16        99.3%   Ukrainian    +    0.7%   Selkup    @    4.36
17        99.6%   Ukrainian    +    0.4%   Ket    @    4.37
18        99.9%   Ukrainian    +    0.1%   Papuan    @    4.38
19        99.8%   Ukrainian    +    0.2%   Shors    @    4.38
20        99.7%   Ukrainian    +    0.3%   Tatar    @    4.38
а вот MDLP k13, показывает, русский тверь, что тоже правда, только по другой линии.

Оффлайн FenriR

  • Сообщений: 2074
  • Страна: 00
  • Рейтинг +552/-2
  • Y-ДНК: N1c1-L1025
  • мтДНК: K1a
Re: Polako/Davidski Eurogenes plots
« Ответ #1226 : 27 Апрель 2016, 15:40:31 »
да, согласен.
у меня показывает мою, можно сказать - преобладающую, белорусскую сторону=)
# Primary Population (source) Secondary Population (source) Distance
1 71.7% Belorussian + 28.3% Kargopol_Russian @ 2.46
2 81.5% Estonian_Polish + 18.5% East_Finnish @ 2.47
3 79.4% Belorussian + 20.6% East_Finnish @ 2.52
4 83.8% Estonian_Polish + 16.2% Finnish @ 2.56
5 91.3% Belorussian + 8.7% Chuvash @ 2.6
6 89.2% Belorussian + 10.8% Tatar @ 2.76
7 93.4% Belorussian + 6.6% Mari @ 2.77
8 78% Estonian_Polish + 22% Kargopol_Russian @ 2.83
9 91.4% Estonian_Polish + 8.6% Tatar @ 2.84
10 97.7% Estonian_Polish + 2.3% Xibo @ 2.84
11 87% Estonian_Polish + 13% Southwest_Finnish @ 2.84
12 95.8% Belorussian + 4.2% Shors @ 2.85
13 97.7% Estonian_Polish + 2.3% Hezhen @ 2.85
14 97.7% Estonian_Polish + 2.3% Tu @ 2.86
15 96.1% Estonian_Polish + 3.9% Uygur @ 2.86
16 97.8% Estonian_Polish + 2.2% Japanese @ 2.86
17 91.4% Estonian_Polish + 8.6% North_Swedish @ 2.86
18 97.9% Estonian_Polish + 2.1% Naxi @ 2.87
19 88.4% Estonian_Polish + 11.6% La_Brana-1 @ 2.88
20 97.9% Estonian_Polish + 2.1% Yizu @ 2.88

Оффлайн valera27

  • Сообщений: 732
  • Страна: ru
  • Рейтинг +161/-0
  • Y - R1a1a-YP682(xYP1260,YP612,YP1696); mt - H1a
Re: Polako/Davidski Eurogenes plots
« Ответ #1227 : 27 Апрель 2016, 16:35:07 »
А у меня не так чтоб уж и близко :))

Eurogenes EUtest V2 K15 Oracle results:

#       Primary Population (source)   Secondary Population (source)   Distance
1       50.2%   Ukrainian_Belgorod   +   49.8%   Estonian   @   3.71
2       52.8%   Ukrainian_Lviv   +   47.2%   Lithuanian   @   3.84
3       55.7%   Ukrainian   +   44.3%   Lithuanian   @   3.91
4       55.2%   Southwest_Russian   +   44.8%   Estonian   @   3.96
5       52.2%   Estonian   +   47.8%   Ukrainian_Lviv   @   4.15
6       93.1%   Estonian   +   6.9%   Abhkasian   @   4.27
7       92.8%   Estonian   +   7.2%   Georgian   @   4.29
8       92.6%   Estonian   +   7.4%   Armenian   @   4.3
9       92.2%   Estonian   +   7.8%   Kurdish   @   4.3
10       92.1%   Estonian   +   7.9%   Iranian   @   4.3
11       92.6%   Estonian   +   7.4%   Georgian_Jewish   @   4.33
12       51%   Ukrainian   +   49%   Estonian   @   4.33
13       91.2%   Estonian   +   8.8%   Kumyk   @   4.33
14       91.9%   Estonian   +   8.1%   Adygei   @   4.33
15       92.7%   Estonian   +   7.3%   Assyrian   @   4.39
16       91.8%   Estonian   +   8.2%   Balkar   @   4.39
17       91.6%   Estonian   +   8.4%   Kabardin   @   4.39
18       92.2%   Estonian   +   7.8%   North_Ossetian   @   4.39
19       71.4%   Lithuanian   +   28.6%   Moldavian   @   4.45
20       93%   Estonian   +   7%   Iranian_Jewish   @   4.46

Оффлайн Don

  • Сообщений: 505
  • Страна: aq
  • Рейтинг +51/-0
Re: Polako/Davidski Eurogenes plots
« Ответ #1228 : 27 Апрель 2016, 18:20:18 »
В основном: то ли украинец, то ли белорус, или : русский, литовец, поляк.
И в малом возможно: румын, грек, армянин, турок, кумык, адыг, болгарин, итальянец, курд и многия многия.

1   71.8% Ukrainian_Belgorod + 28.2% Romanian 3.4
2   81% Ukrainian_Belgorod + 19% Greek_Thessaly 3.42
3   83.3% Belorussian + 16.7% Armenian 3.47
4   87.4% Southwest_Russian + 12.6% Armenian 3.53
5   54% Ukrainian_Belgorod + 46% Moldavian 3.55
6   80.2% Belorussian + 19.8% Kumyk 3.57
7   86.9% Russian_Smolensk + 13.1% Armenian 3.59
8   74.7% Ukrainian_Belgorod + 25.3% Bulgarian 3.6
9   87.6% Ukrainian + 12.4% Adygei 3.6
10  69.3% Southwest_Russian + 30.7% Romanian 3.62
11  88% Ukrainian + 12% North_Ossetian 3.62
12  84.4% Ukrainian_Belgorod + 15.6% Central_Greek 3.63
13  76% Lithuanian + 24% Turkish 3.64
14  85.9% Ukrainian_Belgorod + 14.1% South_Italian 3.66
15  89% South_Polish + 11% Kurdish 3.67
16  87.4% South_Polish + 12.6% Kumyk 3.67
17 86.4% Ukrainian + 13.6% Kumyk 3.68
18  87% Ukrainian + 13% Kabardin 3.68
19  89.9% Ukrainian + 10.1% Abhkasian 3.71
20  79.2% Southwest_Russian + 20.8% Greek_Thessaly 3.71

Оффлайн FenriR

  • Сообщений: 2074
  • Страна: 00
  • Рейтинг +552/-2
  • Y-ДНК: N1c1-L1025
  • мтДНК: K1a
Re: Polako/Davidski Eurogenes plots
« Ответ #1229 : 27 Апрель 2016, 18:41:58 »
Don,
да как-то больше на Центральную Украину похоже, может быть, с некоторым трендом на восток)

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.