АвторТема: EthnoGraph  (Прочитано 5689 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Alex AXeАвтор темы

  • Сообщений: 319
  • Страна: ua
  • Рейтинг +39/-0
  • Y-ДНК: J1 Z1842+ CTS1460-
  • мтДНК: I1a1c
EthnoGraph
« : 23 Декабрь 2012, 21:03:12 »
Обновлено:

Написал вот такую утилитку: http://db.tt/cSknoNa8 (версия 092)

Делает PCA и рисует PCA плоты.
При загрузке данных выборки генерирует файл с результатами PCA (для тех, кому он интересен).
В архив добавлены файлы данных калькуляторов с использованием точки (а не запятой) как разделителя целой и дробной частей - для тех, у кого такие настройки системы.

Версия 093: http://db.tt/5w7sxGOM

Добавлена возможность "скрывать" достаточно удаленные точки (расстояние вычисляется по всем осям, а не только по отображаемым). Уровень "скрытия" можно плавно менять.
Добавлена возможность вместо своих персональных данных использовать данные какой-либо выборки. Удобно при анализе различных народов.
« Последнее редактирование: 26 Декабрь 2012, 03:08:00 от Alex AXe »

Оффлайн Alex AXeАвтор темы

  • Сообщений: 319
  • Страна: ua
  • Рейтинг +39/-0
  • Y-ДНК: J1 Z1842+ CTS1460-
  • мтДНК: I1a1c
Re: EthnoGraph
« Ответ #1 : 24 Декабрь 2012, 23:55:42 »
Вот в качестве примера мой результат по первым двум компонентам в MDLP-World22:

Оффлайн Kartveli

  • Сообщений: 525
  • Страна: ge
  • Рейтинг +155/-0
    • Georgian DNA Project
  • Y-ДНК: J-BY70
  • мтДНК: D4c2b
Re: EthnoGraph
« Ответ #2 : 25 Декабрь 2012, 08:38:53 »
А можно поподробнее, как ей пользоваться? (вводить данные и т.д.) А то у меня при открытии текстовых файлов выдает ошибку. (

Оффлайн Alex AXeАвтор темы

  • Сообщений: 319
  • Страна: ua
  • Рейтинг +39/-0
  • Y-ДНК: J1 Z1842+ CTS1460-
  • мтДНК: I1a1c
Re: EthnoGraph
« Ответ #3 : 25 Декабрь 2012, 12:38:18 »
При открытии каких файлов выдает ошибку, тех которые к ней прилагаются?  ???
Очень странно. А что именно пишет?

Оффлайн obs_il

  • Сообщений: 35
  • Страна: be
  • Рейтинг +0/-0
  • Y-ДНК: R1a1a
  • мтДНК: H1a3
Re: EthnoGraph
« Ответ #4 : 25 Декабрь 2012, 12:59:06 »

Оффлайн Аббат Бузони

  • ...
  • Сообщений: 19863
  • Страна: ru
  • Рейтинг +1812/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!
Re: EthnoGraph
« Ответ #5 : 25 Декабрь 2012, 14:09:29 »
Такая же петрушка

Оффлайн Kartveli

  • Сообщений: 525
  • Страна: ge
  • Рейтинг +155/-0
    • Georgian DNA Project
  • Y-ДНК: J-BY70
  • мтДНК: D4c2b
Re: EthnoGraph
« Ответ #6 : 25 Декабрь 2012, 14:44:54 »
dll я скачал, программа запустилась. но потом уже, при открытии текстовых файлов, снова выдает ошибку. выложу скрины вечером

Оффлайн Kartveli

  • Сообщений: 525
  • Страна: ge
  • Рейтинг +155/-0
    • Georgian DNA Project
  • Y-ДНК: J-BY70
  • мтДНК: D4c2b
Re: EthnoGraph
« Ответ #7 : 25 Декабрь 2012, 20:21:07 »
При выборе калькулятора



При нажатии на PCA



Оффлайн Alex AXeАвтор темы

  • Сообщений: 319
  • Страна: ua
  • Рейтинг +39/-0
  • Y-ДНК: J1 Z1842+ CTS1460-
  • мтДНК: I1a1c
Re: EthnoGraph
« Ответ #8 : 25 Декабрь 2012, 20:28:51 »
А, все понятно. Нужно заменить все запятые в файле калькулятора на точки, так как у Вас в настройках системы установлена точка, как разделить целой и дробной частей.

Сейчас добавлю в архив модифицированные файлы. Заодно новую версию скачаете (я только что обновил ее).

Оффлайн Alex AXeАвтор темы

  • Сообщений: 319
  • Страна: ua
  • Рейтинг +39/-0
  • Y-ДНК: J1 Z1842+ CTS1460-
  • мтДНК: I1a1c
Re: EthnoGraph
« Ответ #9 : 25 Декабрь 2012, 21:02:31 »
Все сделано. Вырожденный вектор тоже можно выбирать за одну из осей, чтобы получить одномерный плот, если в нем возникнет необходимость.

Онлайн Srkz

  • Сообщений: 8384
  • Страна: ru
  • Рейтинг +4762/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Re: EthnoGraph
« Ответ #10 : 25 Декабрь 2012, 21:12:37 »
Не пойму, то ли баг, то ли фича - отдельные популяции явно не на своем месте. Допустим, для World-22 PCA1x2 Colville рядом с Ukrainian-East и Indian между Vepsa и Komi. Даже, если подумать, ощущение, что несколько плотов наложилось друг на друга и башкиры оказались с чукчами а пуэрториканцы с сербами.

Оффлайн Alex AXeАвтор темы

  • Сообщений: 319
  • Страна: ua
  • Рейтинг +39/-0
  • Y-ДНК: J1 Z1842+ CTS1460-
  • мтДНК: I1a1c
Re: EthnoGraph
« Ответ #11 : 25 Декабрь 2012, 21:19:35 »
Не пойму, то ли баг, то ли фича - отдельные популяции явно не на своем месте. Допустим, для World-22 PCA1x2 Colville рядом с Ukrainian-East и Indian между Vepsa и Komi. Даже, если подумать, ощущение, что несколько плотов наложилось друг на друга и башкиры оказались с чукчами а пуэрториканцы с сербами.
Так и должно быть. Выдаваемый плот - это проекция точки в 21-мерном пространстве (суть PCA - построить такую метрику, чтобы все векторы были ортогональными) на 2-мерную плоскость. Если взять другие оси, то, скажем чехи все равно будут рядом со словаками, а вот лумби (которые попадают между ними при выборе пары PCA1 и PCA3) окажутся далеко.

Кстати, этноплот 23иЯ похожим образом устроен (при разных масштабах выбираются разные оси).

Да и у Макдональда белорусы возле ирландцев.

Оффлайн Kartveli

  • Сообщений: 525
  • Страна: ge
  • Рейтинг +155/-0
    • Georgian DNA Project
  • Y-ДНК: J-BY70
  • мтДНК: D4c2b
Re: EthnoGraph
« Ответ #12 : 25 Декабрь 2012, 21:26:38 »
Заработало. Спасибо!



Онлайн Srkz

  • Сообщений: 8384
  • Страна: ru
  • Рейтинг +4762/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Re: EthnoGraph
« Ответ #13 : 25 Декабрь 2012, 21:38:38 »
Так и должно быть. Выдаваемый плот - это проекция точки в 21-мерном пространстве (суть PCA - построить такую метрику, чтобы все векторы были ортогональными) на 2-мерную плоскость. Если взять другие оси, то, скажем чехи все равно будут рядом со словаками, а вот лумби (которые попадают между ними при выборе пары PCA1 и PCA3) окажутся далеко.
Значит, фича :) Просто, как я понимаю, чем меньше номер оси, тем большее значение она имеет и смысл преобразования PCA в выделении наиболее информативных осей. Или нет?

Оффлайн Alex AXeАвтор темы

  • Сообщений: 319
  • Страна: ua
  • Рейтинг +39/-0
  • Y-ДНК: J1 Z1842+ CTS1460-
  • мтДНК: I1a1c
Re: EthnoGraph
« Ответ #14 : 25 Декабрь 2012, 21:46:40 »
Значит, фича :) Просто, как я понимаю, чем меньше номер оси, тем большее значение она имеет и смысл преобразования PCA в выделении наиболее информативных осей. Или нет?
Да. Степень информативности каждой оси можно посмотреть в генерируемом файлике (столбец EIGENVALUES)
По сути у нас все оси информативны, но некоторые больше, некоторые меньше. Видимо, это специфика самого калькулятора.

Взяв за базис малоинформативные оси, получим на плоте тесную "кучу" популяций и несколько "выбросов". Информация о специфических качествах последних как раз и содержится в малоинформативных осях.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.