АвторТема: Проект Magnus Ducatus Lituaniae  (Прочитано 204732 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Проект Magnus Ducatus Lituaniae
« Ответ #165 : 01 Июль 2011, 19:56:04 »
То же самое, но в режиме "supervised analysis"

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Проект Magnus Ducatus Lituaniae
« Ответ #166 : 02 Июль 2011, 01:43:06 »
Пытался сегодня запустить на на сервере компании KIRE процесс structure для выявления структуры популяций и геномов проекта (размер входного файла 145 MB).  :)

Однако, видимо, запуск такого программного обеспечения не входит в рамки дозволенной деятельности на этом сервере. В результате чего тот аккаунт мне прикрыли.

 >:(

Цитировать
ABUSE INCIDENT INFORMATION / POLICY VIOLATION
=============================================

Abusive Login Name: vadim78
Hosted on System: blazer
Suspended @ Fri Jul  1 17:28:44 EDT 2011
STAFF Comment: excessive resource usage, structure


Так что со STRUCTURE придется повременить. :(

Оффлайн Valery

  • Сообщений: 10107
  • Страна: 00
  • Рейтинг +1380/-7
  • Ultimate Matriarchy
Re: Проект Magnus Ducatus Lituaniae
« Ответ #167 : 02 Июль 2011, 10:09:10 »
(размер входного файла 145 MB).  :)

 ???

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Проект Magnus Ducatus Lituaniae
« Ответ #168 : 02 Июль 2011, 18:27:16 »
(размер входного файла 145 MB).  :)

 ???

Это много или мало? :)

Оффлайн mouglley

  • ...
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3

Оффлайн sanych_85

  • Сообщений: 370
  • Страна: ru
  • Рейтинг +27/-0
  • Y-ДНК: E1b1b1a1b
  • мтДНК: H, H6a1b (по отцу)
Re: Проект Magnus Ducatus Lituaniae
« Ответ #170 : 03 Август 2011, 16:37:08 »
Написал Вадиму ,что на мой взгляд перепутаны данные Finno-Ugric и Balto-Slavs либо допущена какая то ошибка. У подавляющего большинства участников проекта показатели  Finno-Ugric существенно больше Balto-Slavs, при том, что участники в основном как раз принадлежат к балтам или славянам. Также это существенно противоречит  данным Polako и Deinekes'а.

Оффлайн VictorV.

  • Сообщений: 5838
  • Страна: ru
  • Рейтинг +408/-17
    • Дворянский род Безручко-Высоцких и другие фамилии.
  • Y-ДНК: J-ZS3127
  • мтДНК: V16
Re: Проект Magnus Ducatus Lituaniae
« Ответ #171 : 04 Август 2011, 01:00:01 »
Написал Вадиму ,что на мой взгляд перепутаны данные Finno-Ugric и Balto-Slavs либо допущена какая то ошибка. У подавляющего большинства участников проекта показатели  Finno-Ugric существенно больше Balto-Slavs, при том, что участники в основном как раз принадлежат к балтам или славянам. Также это существенно противоречит  данным Polako и Deinekes'а.
Полностью с вами согласен. Например моя составляющая "финно-угрик" по всем другим проектам колеблется в районе единиц процентов. Надо проверить всё ещё раз -вполне возможно, что при вводе данных, могла произойти опечатка.

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Проект Magnus Ducatus Lituaniae
« Ответ #172 : 28 Август 2011, 18:01:25 »
Я модифицировал DIYDodecad calculator v2.0 под свой BGA проект (MDLP).
Теперь, подобно проекту Dodecad, каждый из лиц, не включенных в проект по той или иной причине, может самостоятельно проанализировать %-ное соотношение генетических компонентов по аллельным частотам, определенным в ходе последнего K=7 запуска Admixture.

Загрузите MDLP.zip файл  (File -> Download original) и разархивируйте его в директорию, где находятся основные файлы  DIYDodecad. Затем запустите MDLP модификацию путем ввода в Command prompt команды  DIYDodecadWin MDLP.par

Оффлайн mladshij

  • Сообщений: 801
  • Страна: ru
  • Рейтинг +119/-0
  • Darth Vader
  • Y-ДНК: R1a-Z92 -> YP569 -> Y85137
  • мтДНК: H1
Re: Проект Magnus Ducatus Lituaniae
« Ответ #173 : 29 Август 2011, 16:35:14 »
По разным людям (которые протестированы у меня в 23andme) получились весьма различные данные.

Две крайности:
1) частично русский, частично поляк (хотя по вашему проекту он получился чистокровным русским)
 11.82%  Scandinavian       
 11.56%  Volga_Region       
  4.53%  Altaic             
 11.36%  Celto_Germanic     
  8.18%  Caucassian_Anatolian
 51.45%  Balto_Slavic       
  1.10%  North_Atlantic     
2) коренной вятич
 22.76%  Scandinavian       
 12.04%  Volga_Region       
  6.49%  Altaic             
 14.01%  Celto_Germanic     
  6.51%  Caucassian_Anatolian
 31.16%  Balto_Slavic       
  7.02%  North_Atlantic     

По параметрам Scandinavian, Balto_Slavic, North_Atlantic отличия весьма существенные.

А какие значения будут для "типового" русского для такого выбора референсных популяций?

Оффлайн Tanasquel

  • Сообщений: 959
  • Страна: ru
  • Рейтинг +125/-0
  • Всем всего светлого и ясного
  • Y-ДНК: G2a-CTS 342
  • мтДНК: U5a1
Re: Проект Magnus Ducatus Lituaniae
« Ответ #174 : 29 Август 2011, 16:53:23 »
Чё то  я вообще ничего не понял как пользовать программу.Научите ламера  :( :'(

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Проект Magnus Ducatus Lituaniae
« Ответ #175 : 29 Август 2011, 19:56:44 »

А какие значения будут для "типового" русского для такого выбора референсных популяций?

У классических русских (из Центрального Региона) % соотношение Balto-Slavic в интервале больше 30-40% и высокий % Volga Region - больше 10%. Северные россияне имеют повышение скандинавского компонента.
« Последнее редактирование: 29 Август 2011, 20:06:03 от I2a2a »

Оффлайн VictorV.

  • Сообщений: 5838
  • Страна: ru
  • Рейтинг +408/-17
    • Дворянский род Безручко-Высоцких и другие фамилии.
  • Y-ДНК: J-ZS3127
  • мтДНК: V16
Re: Проект Magnus Ducatus Lituaniae
« Ответ #176 : 29 Август 2011, 22:14:38 »
Вадим, узбеков вы зря взяли за эталон алтайской группы с 99.9%. Кроме того, что Туркестан сам по себе является самым активным в мире  перекрёстком народов и рас, узбеки же, в современном их представлении, сами по себе невероятно разнородная этно-группа, включающая в себя не менее 20-30 различных племён и народностей, при сём диапазон антропологических типов колеблется от русоволосых нордидов(изредка даже попадаются и блондины), особенно среди хивинцев, до типичнейших монголоидов и дравидидов.
Рекомендую сделать корректировки на сей счёт. Киргизы или скажем сами алтайцы куда более однородны.

Оффлайн Valikhan

  • Группа N
  • *
  • Сообщений: 2193
  • Страна: kz
  • Рейтинг +102/-1
  • Ysearch 63CDM. Mitosearch EEVT3
    • Turkic World
  • Y-ДНК: N1c1d1 - L1034 (L1032, L1033)
  • мтДНК: B5a1a
Re: Проект Magnus Ducatus Lituaniae
« Ответ #177 : 29 Август 2011, 23:37:50 »
Я модифицировал DIYDodecad calculator v2.0 под свой BGA проект (MDLP).
Для сравнения:

Это результат оригинального калькулятора Динекеса:

East_European      10.52
West_European     10.28
Mediterranean       4.82
Neo_African          0.00
West_Asian          12.94
South_Asian         4.20
Northeast_Asian    27.30
Southeast_Asian   29.66
East_African         0.00
Southwest_Asian   0.14
Northwest_African 0.00
Palaeo_African       0.14
   

Это модифицированный:

13.63% Scandinavian
29.42% Volga_Region
39.91% Altaic
0.00% Celto_Germanic
16.83% Caucassian_Anatolian
0.20% Balto_Slavic
0.00% North_Atlantic

Это Поляко

EU9d
KZ1

 West European          0.00001       
 East European           0.067899
Northwest European   0.00001
 North European         0.00001
 East Asian                0.292409
 South European        0.133878
 Sub-Saharan African 0.00001
 North Asian              0.281105
 Baltic                      0.22467

Между тремя тестами в азиатских и средиземноморско-кавказских компонентах разница незначительная, учитывая разную "заточенность" проектов. Но вот огромная разница в балтийском компоненте между тестом Вадима и Поляко не объяснима. Вернее объяснима с той точки зрения, что тест Поляко перекошен в сторону балтийской составляющей. Уж почему так получилось...

Оффлайн Valikhan

  • Группа N
  • *
  • Сообщений: 2193
  • Страна: kz
  • Рейтинг +102/-1
  • Ysearch 63CDM. Mitosearch EEVT3
    • Turkic World
  • Y-ДНК: N1c1d1 - L1034 (L1032, L1033)
  • мтДНК: B5a1a
Re: Проект Magnus Ducatus Lituaniae
« Ответ #178 : 30 Август 2011, 00:03:06 »
Чё то  я вообще ничего не понял как пользовать программу.Научите ламера  :( :'(

Вы скачали и установили те программы, что требовались?

1. Тогда запустите R, вылезут два окошка, маленькое в большом.
2. Нажмите слева вверху File, кликните Change dir. и выберите папку куда вы распаковали файлы Диенекеса (не забудьте закинуть в эту же папку ваш распакованный геном).
3. В маленьком окошке вбейте эту команду source('standardize.r'). Это запустит программу, никаких окошек или буковок на этом этапе не вылезет.
4. а) Вбейте эту команду если геном от 23andme standardize('ВАШ ГЕНОМ.txt', company='23andMe'). Вместо "ВАШ ГЕНОМ" настоящее название файла.
   б) Вбейте эту команду, если ваш геном от ФТДНА standardize('ВАШ ГЕНОМ.csv', company='ftdna'). Вместо "ВАШ ГЕНОМ" настоящее название файла.
5. На этом этапе программа начнёт обрабатывать файл вашего генома под свои требования. Будет слышен звук работающего жёсткого диска, а когда наведёте курсор на маленькое окошко, то увидите значок ожидания ( в 7-й винде вращающийся круг). Через некоторое время в зависимости от мощности процесса, звук работающего жёсткого диска прекратится, значок ожидания исчезнет, а в папке с данными от Диенекеса появится файл под названием genotype, размером примерно с файл вашего генома.

6. В этом же маленьком окошке вбейте команду system('DIYDodecadWin dv3.par'). Это запустит собственно калькулятор. Будут такие же звуки и знаки как и в пункте 5. Затем в окошке вылезут разные надписи и через некоторое время появятся проценты и названия компонентов. Одновременно в папке возникнет текстовый файл genomewide, где будут эти же проценты и названия. Это будет результат по всему геному.

7. Откройте Notepadом файл dv3.par. Замените genomewide на bychr, сохраните файл. Вбейте эту команду system('DIYDodecadWin dv3.par'), будет то же самое что в пункте 6, только дольше по времени. Через какое-то время появятся результаты по каждой хромосоме и создастся тесктовый файл bychr, где будут результаты по каждой хромосоме.

8. Откройте Notepadом файл dv3.par. Замените bychr на byseg 500 50, сохраните файл. Вбейте команду system('DIYDodecadWin dv3.par'), будет то же самое что в пункте 6 и 7, только ещё дольше по времени. В конце выйдут результаты по сегментам хромосом  и создастся тесктовый файл byseg. Значения 500 и 50 можете менять по вашему усмотрению.

Как освоите и получите результат на этом этапе, перейдём к визуализации ваших хромосом.

PS. Забыл добавить, что после каждой команды нужно нажимать Enter, чтобы её запустить. В окошке управление через клавиатуру, поэтому используйте стрелки, Enter, Back, Delete и другие стандартные комбинации типа Ctrl+V.
« Последнее редактирование: 30 Август 2011, 00:33:14 от Valikhan »

Оффлайн I2a1aАвтор темы

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Проект Magnus Ducatus Lituaniae
« Ответ #179 : 30 Август 2011, 00:39:26 »

Это модифицированный:

13.63% Scandinavian
29.42% Volga_Region
39.91% Altaic
0.00% Celto_Germanic
16.83% Caucassian_Anatolian
0.20% Balto_Slavic
0.00% North_Atlantic

Между тремя тестами в азиатских и средиземноморско-кавказских компонентах разница незначительная, учитывая разную "заточенность" проектов. Но вот огромная разница в балтийском компоненте между тестом Вадима и Поляко не объяснима. Вернее объяснима с той точки зрения, что тест Поляко перекошен в сторону балтийской составляющей. Уж почему так получилось...

Спасибо, Валихан за пост, на примере которого можно проиллюстрировать, как методологические различия  в изначальном дизайне BGA-проектов влияют на конечный результат.

Я не буду комментировать методологическую основу в проектах Поляко, Додекад и прочие. Скажу только за свой проект. Вдумчиво руководствуясь инструкциями авторов программы Plink по минимизации популяционного шума, я провел немало времени над тщательным анализом особенностей геномов из референсных панелей. Референсные сэмплы с аномальными свойствами (cэмплы с дистанцией выше 3 стандартных отколнений, высокой гомозиготностью, высокой степенью инбридинга и "фонового" родства) были исключены из проекта.

Далее, на настоящий момент в моей выборке присутствует самое большое количество сэмплов (референсы+донары) из разных регионов бывшего ВКЛ, что позволило мне сделать оценку частот аллелей по примерно 100 000 генетическим маркерам.

Поэтому то, MDLP-модификацию калькулятора Диенекиса следовало бы обозначать как Balto-Slavic Ancestry Finder.  :)

Результаты Валихана это красноречиво подтверждают.
13.63% Scandinavian  - этот элемент достигает пика у финнов, у других скандинавских популяций он примерно в три раза ниже.
Этот компонент было бы правильней обозначить как Paleo-Scandinavian и связать с генетическим наследием мезолитического населения Скандинавии (Y-I1, mtdna U5), обменивавшегося генами с аналогичными популяциями Урала и северо-востока Сибири
Однако без анализа представителей этноса саами, выводы преждевременны.

29.42% Volga_Region - этот компонент достигает пика в чувашской метапопуляции, на втором месте -финны. Я предполагаю связь компонента с миграциями эндоуральцев (термин Напольских), носителей гаплогрупп N1c.При анализе более низкого уровня (K<= 5) этот компонент образует единое целое с алтайским компонентам

39.91% Altaic - из доступных референсных популяций достигает максимума у узбеков. Интересно сравнить с уйгурами, у которых он должен быть еще выше

0.00% Celto_Germanic -думаю, тут все понятно.

16.83% Caucassian_Anatolian - можно объяснить наличием тысячелетным генетическим обменом между популяциями Кавказа и Центральной Азии (доисторические миграции, БМАК, скифы, аланы и т.д.)

0.20% Balto_Slavic -думаю, тут все понятно.
0.00% North_Atlantic -думаю, тут все понятно.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.