АвторТема: Полезные ссылки по аутосомным калькуляторам и другая информация  (Прочитано 36672 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн SrkzАвтор темы

  • Сообщений: 8640
  • Страна: ru
  • Рейтинг +5004/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Так как искать информацию, разбросанную по разным темам довольно сложно, я решил собрать полезные ссылки в одном месте. По мере возможности буду добавлять, поскольку за раз все охватить тяжело.

FAQ (часто задаваемые вопросы и ответы на них) по аутосомным калькуляторам

Оболочка для запуска аутосомных калькуляторов без установки R и работы с командной строкой:
http://www.y-str.org/tools/diy-dodecad-wrapper/
На текущий момент в программу встроены только калькуляторы проекта DODECAD (Диенек). Запустите программу, выберите свой файл raw data (предварительно разархивировав) и нажмите Calculate.
Update Пытался запускать у себя, нормально так и не заработала

Программа Диенека Do-It-Yourself DODECAD V2.1 http://dodecad.blogspot.ru/2011/09/do-it-yourself-dodecad-v-21.html (необходима для самостоятельного запуска калькуляторов без заливки данных на Gedmatch).
Инструкция по запуску.
Подготовка к работе:
1) Для работы необходима программа R, скачиваем и устанавливаем отсюда: http://www.r-project.org/
2) Распаковываем содержимое архива DODECAD к себе на компьютер (далее для примера буду считать, что архив распакован в папку C:\DYD, назовем ее "рабочая папка")
3) Помещаем в рабочую папку файл со своей генетической информацией, скачанной с 23andme https://www.23andme.com/you/download/ или FTDNA (Недавно добавлено GENO 2.0, смотрите http://dodecad.blogspot.ru/2012/11/geno-20-patch-for-diydodecad.html). Назовем его johndoe (по русски будет Имярек  :)   )
4) Для перекодировки файла в формат DYD:
 4.1) Запускаем R
 4.2) В R выполняем команду setwd('c:\\DYD')
 4.3) Выполняем source('standardize.r')
 4.4) Выполняем standardize('johndoe.txt', company='23andMe') для пользователей 23andme
        Или standardize('johndoe.csv', company='ftdna') для пользователей FTDNA
 4.5) В рабочей папке должен появиться файл genotype.txt

Запуск калькулятора:
5) Распаковываем нужный калькулятор в рабочую папку. В исходный архив уже вложен калькулятор DODECAD v3, его и возьмем в качестве примера.
6) Запускаем R, выполняем setwd('c:\\DYD')
7) Выполняем system('DIYDodecadWin dv3.par'). Для других калькуляторов название командного файла .par будет, соответственно, другим.
8 ) Итоговый результат выведется на экран, а также в файл genomewide.txt

Для вывода результата в похромосомном режиме отредактируйте файл .par, заменив строчку genomewide (последняя) на bychr

Работа с Оракулом:
9) Запускаем файл Оракула, например,DodecadOracleV1.RData для нашего примера
10) Выполняем команду DodecadOracle(c(a,b,c...),,k=50), где (a, b, c...) - наши значения по компонентам калькулятора (можно взять из файла genomewide.txt), разделенные запятыми. В самих значениях целая часть от дробной отделяется точкой. k=50 означает "Вывести 50 ближайших популяций". Чтобы вывести варианты смешанных популяций, используем формат команды DodecadOracle(c(a,b,c...),k=50, mixedmode=T). Большие/маленькие буквы имеют значение. Для калькуляторов Вадима Веренича используем команду  MOracle  вместо DodecadOracle

Рекомендовано к использованию в первую очередь (с оракулом четырех предков):
Наиболее свежий калькулятор от Вадима Веренича K27 beta
Файл для оракула четырех предков
Таблица популяций
Карта распространения компонентов  :)

Другие калькуляторы:
Разнообразные калькуляторы Диенека: http://dodecad.blogspot.ru/search/label/DIYDodecad

Калькуляторы JTest и EUTest Polako Файлы для DIYDodecad, данные по исходным популяциям, карты распространения компонентов.
Калькулятор EUTest V2 Данные по исходным популяциям, карты распространения компонентов
Прямая ссылка на файлы для DYDodecad.
Калькулятор K36
Усреднения по восточноевропейским популяциям для K36
Файл для "Оракула четырех предков" по тем же популяциям
Информация по более старым калькуляторам

Калькулятор Вадима Веренича World-22 https://docs.google.com/open?id=0B6n7iMc2P-yQMnN2OXVERlhjSXM
Оракул World-22
Исходные популяции World-22
Карты распространения компонентов
Предыдущий калькулятор Вадима MDLP World для K= от 5 до 15 (в 13 перепутаны аллели)

Калькулятор Harappa World http://www.harappadna.org/2012/05/diy-harappaworld/
Оракул Harappa World (команда HarappaOracle)

Таблица усредненных популяций для девяти основных калькуляторов

"Оракул четырех предков"
"Оракул четырех предков" (программа ув. Alex AXe)
Статистика по доле генома, наследуемого от каждого из четырех предков
EthnoGraph ув. Alex AXe для построения PCA-плотов

Использование "Оракула четырех предков" (скопировано из профильной темы):
С 4 декабря Оракул четырех предков доступен в полном объеме на сайте gedmatch.com (для калькуляторов, у которых есть и обычный оракул - это все калькуляторы проектов MDLP, DODECAD, Harappa и калькуляторы JTest, EUTest проекта Eurogenes). Используйте кнопку Oracle-4 на странице вывода результатов нужного калькулятора. Расчет делается методом минимизации среднеквадратичного отклонения, результаты могут несколько отличаться от выложенных ранее в этой теме из-за различия в исходных данных популяций.

Уважаемый Alex AXe разработал программу, рассчитывающую возможных четырех предков по разным алгоритмам и с возможностью подстановки данных из разных калькуляторов.
Версия 0.97 (самая свежая на момент изменения этого сообщения): http://db.tt/634mFXL2
Комментарий автора:
Сделал нормальную реализацию метода постоянной дисперсии и нормальную нормировку расстояний в нем. Удалось немножко его оптимизировать.

Полностью пересмотрел модель шума и порогов.
Теперь не используется параметр "порог метода", вместо него в соответствующей строчке файла input.txt нужно поставить 1 для использования gaussian-метода и 0 для его отключения. Метод наименьших квадратов будет использован в обоих случаях.

Формат input.txt для версии 0.97:
1-я строка: имя (условное) человека, чьи данные анализируются.
2-я строка: имя файла с данными популяций
3-я строка: имя файла с результатами
4-я строка: число выдаваемых результатов приближений. Для режима 4-х предков будет выдано удвоенное число результатов.
5-я строка: минимальный порог компонентов. Значения меньше его будут отброшены. Для автоопределения порога нужно ввести минус единицу.
6-я строка: 1 для использования Gaussian или же 0 для использования только LSM
7-я и далее строки: значения компонентов

Кстати, долгожданный графический интерфейс готов. Сделал его отдельной программой. При запуске нужно выбрать используемый калькулятор (путем указания файла с данными популяций) и потом ввести значения для конкретного человека.
После нажатия на кнопку "Go!" будет сгенерирован input.txt и запустится внешняя программа расчетов.
Можно одновременно запускать несколько для разных данных одного калькулятора (так как input.txt читается только в момент начала расчетов). Естественно, выходные файлы указывать разными. Смотреть их все так же -блокнотом.

Версия 0,95: http://db.tt/q5pEFZCh

Комментарии автора (несколько отредактированы для удобства):

Просто редактируйте файл input.txt подставляя туда свои значения из результатов калькулятора (вместо прочерков для отсутствующих компонент вводите нули).

В начале файла input.txt указываются следующие параметры:
1. Имя (условное) тестируемого. Сделано для удобства идентификации данных, также это имя потом указывается в выходном файле.
2. Имя файла с данными популяций.
3. Имя файла с результатами. Сделано для удобства.
4. Число выдаваемых приближений.
5. Порог компонента. Значения компонентов, которые меньше его, принимаются равными нулю.
6. Порог метода. При вычислении расстояний между данными и приближением, расстояние между компонентами, меньшие этого порога, не учитываются.
7. Номер метода вычисления расстояний, который будет использован. Доступно 8 методов с номерами от 0 до 7, показавших наилучшие результаты. Ноль соответствует методу квадратов. Если указать в качестве номера метода отрицательное число, то будут последовательно использованы все методы.

Как и было обещано, теперь выдаются приближения не только для 4 предков, но и для меньшего их числа. В случае 3-х предков, считается, что первый - это один из родителей, а остальные двое - это бабушка и дедушка со стороны другого родителя.

Еще один калькулятор (устаревший) http://esquilax.stanford.edu/#painting
« Последнее редактирование: 16 Июнь 2014, 19:15:13 от Srkz »

Оффлайн Санька

  • Сообщений: 159
  • Страна: 00
  • Рейтинг +9/-3
Спасибо за ссылки. Они как раз кстати, так как Gedmatch не принимает сырые данные до 15/08.

Оффлайн Санька

  • Сообщений: 159
  • Страна: 00
  • Рейтинг +9/-3

Калькуляторы JTest и EUTest Polako http://bga101.blogspot.com.au/2012/09/eurogenes-ashkenazim-ancestry-test-files.html (Файлы для DIYDodecad, данные по исходным популяциям, карты распространения компонентов)
Информация по более старым калькуляторам http://bga101.blogspot.com.au/2012/05/geographicethnic-peaks-in-eurogenes.html


Извиняюсь за назойливость, но совершенно непонятно как пользоваться 'калькуляторами'. Автор предлагает 3 файла на каждый 'калькулятор', а инструкций никаких.

Edit: EUtest.13.P - это программка для Матлаба ?
« Последнее редактирование: 09 Июнь 2013, 14:27:48 от Санька »

Оффлайн SrkzАвтор темы

  • Сообщений: 8640
  • Страна: ru
  • Рейтинг +5004/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Извиняюсь за назойливость, но совершенно непонятно как пользоваться 'калькуляторами'. Автор предлагает 3 файла на каждый 'калькулятор', а инструкций никаких.

Edit: EUtest.13.P - это программка для Матлаба ?
Он там ниже в комментариях приводит ссылку на файлы для DYDodecad https://docs.google.com/file/d/0B9o3EYTdM8lQNnRNamU5cVhrTW8/edit?pli=1, должны работать.

Оффлайн Санька

  • Сообщений: 159
  • Страна: 00
  • Рейтинг +9/-3
Получилось завести калькуляторы кроме калькулятора Alex Axe. Постоянно выскакивает ошибка.
Операционная система : MS Windows 7  64 , input.txt редактировал согласно инструкции.


Problem signature:
  Problem Event Name: APPCRASH
  Application Name: Anc_Oracle_097.exe
  Application Version: 0.0.0.0
  Application Timestamp: 2a425e19
  Fault Module Name: KERNELBASE.dll
  Fault Module Version: 6.1.7601.18015
  Fault Module Timestamp: 50b83c8a
  Exception Code: 0eedfade
  Exception Offset: 0000c41f
  OS Version: 6.1.7601.2.1.0.256.48
  Locale ID: 3081
  Additional Information 1: cec9
  Additional Information 2: cec918f3162e41498da9df81e7ee700f
  Additional Information 3: 3cb1
  Additional Information 4: 3cb1670b4a319af827b46728e2c86407


Screenshot: http://img69.imageshack.us/img69/4057/picxej.png
« Последнее редактирование: 10 Июнь 2013, 04:48:42 от Санька »

Оффлайн SrkzАвтор темы

  • Сообщений: 8640
  • Страна: ru
  • Рейтинг +5004/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Получилось завести калькуляторы кроме калькулятора Alex Axe. Постоянно выскакивает ошибка.
Операционная система : MS Windows 7  64 , input.txt редактировал согласно инструкции.
Возможно, автор программы вам ответит, он бывает на форуме. Попробуйте другой компьютер, или запустить вообще без редактирования файла input.txt, как он есть из архива. Тогда станет понятно, в нем ли дело.

Оффлайн Санька

  • Сообщений: 159
  • Страна: 00
  • Рейтинг +9/-3
Извиняюсь за назойливость, но совершенно непонятно как пользоваться 'калькуляторами'. Автор предлагает 3 файла на каждый 'калькулятор', а инструкций никаких.

Edit: EUtest.13.P - это программка для Матлаба ?
Он там ниже в комментариях приводит ссылку на файлы для DYDodecad https://docs.google.com/file/d/0B9o3EYTdM8lQNnRNamU5cVhrTW8/edit?pli=1, должны работать.

Нет там инструкций. Разбил я свои данные на компоненты, а дальше что? как сравнить с этническими группами, как в MOracle у Веренича?
Ой как все это разбросанно и неорганизованно. Извините, намучился.  :(
« Последнее редактирование: 10 Июнь 2013, 09:27:35 от Санька »

Оффлайн SrkzАвтор темы

  • Сообщений: 8640
  • Страна: ru
  • Рейтинг +5004/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Разбил я свои данные на компоненты, а дальше что? как сравнить с этническими группами, как в MOracle у Веренича?
Ой как все это все разбросанно и неорганизованно. Извините, намучился.  :(
При помощи "Оракула четырех предков", когда запустите  ;D ;D ;D  Ну или вручную сравните с файлами "averages for selected populations" из поста, JTest, EUtest, посчитайте среднеквадратичное отклонение от своих данных в Excel.
« Последнее редактирование: 10 Июнь 2013, 09:38:07 от Srkz »

Оффлайн Санька

  • Сообщений: 159
  • Страна: 00
  • Рейтинг +9/-3
Srkz

Не подскажите где можно старые калькуляторы от Eurogenes проекта скачать? Не могу найти в поисковике.

Оффлайн SrkzАвтор темы

  • Сообщений: 8640
  • Страна: ru
  • Рейтинг +5004/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Для самостоятельного применения их, по-моему, никогда не было, только на gedmatch и рассылка результатов для членов проекта Eurogenes.

Оффлайн SrkzАвтор темы

  • Сообщений: 8640
  • Страна: ru
  • Рейтинг +5004/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Добавил калькуляторы Вадима Веренича World K5-K15

Оффлайн Санька

  • Сообщений: 159
  • Страна: 00
  • Рейтинг +9/-3
Добавил калькуляторы Вадима Веренича World K5-K15

Добавьте, пожалуйста, калькулятор DIY HarappaWorld . Инструкции, диаграммы и объяснения по ссылке : http://www.harappadna.org/2012/05/diy-harappaworld/


Оффлайн SrkzАвтор темы

  • Сообщений: 8640
  • Страна: ru
  • Рейтинг +5004/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Добавьте, пожалуйста, калькулятор DIY HarappaWorld . Инструкции, диаграммы и объяснения по ссылке : http://www.harappadna.org/2012/05/diy-harappaworld/
Добавил

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6333
  • Страна: ru
  • Рейтинг +1337/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Добавьте, пожалуйста, калькулятор DIY HarappaWorld . Инструкции, диаграммы и объяснения по ссылке : http://www.harappadna.org/2012/05/diy-harappaworld/
Добавил

Старик Веренич Вас заметил:)
Цитировать
Я давно планировал написать русскоязычную инструкцию по использованию калькуляторов, основанных на парадигме DIY Dodecad, однако все никак не доходили руки. Пару дней назад уважаемый Srkz с форума Молген написал детальную инструкцию к этим калькуляторам. Поскольку инструкции написаны на простом и доступном языке, мне не остается ничего иного, как просто перепостить инструкции в этом блоге.
http://vadimverenich.blogspot.ru/2013/06/blog-post_1019.html

Оффлайн SrkzАвтор темы

  • Сообщений: 8640
  • Страна: ru
  • Рейтинг +5004/-3
  • Y-ДНК: N-L1025 Y64023
  • мтДНК: U4a1-a C16134T
Старик Веренич Вас заметил:)
Отлично, очень приятно  :)

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.