АвторТема: PLINK  (Прочитано 29394 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Anode

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Re: PLINK
« Ответ #90 : 22 Февраль 2010, 05:35:02 »
Вот решил немного посидеть в выходные.
Загружена новая версия тулкита aisconvert.
(v. 0.94, хотя надо бы уже переименовывать в 1, так как стабильная версия, в продакшене, уже не бета. А эти новые фичи - уже подверсия 1.1, ну да ладно, в следующий раз, сейчас уже лень).


Добавлена фича показа похожести геномов в процентах. А также участков гомозиготности.
Всё - через комманд-лайн.
Загрузив свой геном - по гомозиготности получаю точно те-же участки, что и прогоняя через тул David Pike. Но - за секунду :)
Если лопатить популяции (много файлов) батчем (пакетно) - будет полезно.
Правда, надо побороть лень, и имплементировать показ процентов похожести по каждой хромосоме, и всему генотипу.
Но это уже более очевидно, и - чисто техническая работа.

Спасибо парово3у - за грамотное "озадачивание" (не только подачу идеи - что можно ещё добавить в тулкит, но и разъяснения-ликбез в личке, представленные простыми словами, а что может быть ценнее простоты и хуже ненужной сложности!)

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: PLINK
« Ответ #91 : 03 Май 2010, 23:57:45 »
Anode,

Просветите пожалуйста, что это за опция новая в aisconvert появилась -HapMap ?
Означает ли это, что  aisconvert теперь принимает и фазированные файлы от HapMap?


Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: PLINK
« Ответ #92 : 04 Май 2010, 00:00:08 »
И вообще -версия 0.96 Вашего продукта очень даже хороша.
+1
« Последнее редактирование: 04 Май 2010, 00:06:11 от Vadim Verenich »

Оффлайн Anode

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Re: PLINK
« Ответ #93 : 04 Май 2010, 00:36:43 »
Anode,

Просветите пожалуйста, что это за опция новая в aisconvert появилась -HapMap ?
Означает ли это, что  aisconvert теперь принимает и фазированные файлы от HapMap?




Вау,
а я думал, что никто, кроме паровоЗа, и не знает о сии поделии.
Спасибо.
Если народ будет пользоваться, и есть надежда что появятся те, кто будет заинтересован изменять, расширять прорамму - то можно даже, наверное, начать думать - не надо ли переписывать на Си (я задумывал жабу-версию - как быстрый прототип, и всё-время держал в голове сишную версию).
Если же пойдёт в стороны гуи версии (я здесь рассуждаю только о программе по использованию подобной PLINKу, не серверная библиотека) - то может и не надо:)

П.С. --hapmap замышлялась вначале, но не имплементирована пока (помните, переключились на УПС-калькулятор и забросили hapmap? Там какие-то вопросы возникли, не помню уже, надо топик ещё раз прочитать). В последней версии не работает и опция --cg3 (вернее работает - но как --cg2), так как мы были ещё в дисскуссиях - что делать.
Так что все опции кроме --hapmap и --cg3 должны работать.

Оффлайн Anode

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Re: PLINK
« Ответ #94 : 04 Май 2010, 00:45:02 »
Надо, правда, сначала найти время (приоритет #1) - сделать конвертор 23андме+фтдна, как просил паровоЗ. Что действительно, кажется, нужно.

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: PLINK
« Ответ #95 : 04 Май 2010, 00:50:32 »
Сегодня целый день провозился с конвертированием фазированных данных (по 6 хромосоме неродственных лиц северно-центрального европейского происхождения из панели CEU Hapmаp) в формат, максимально приближенный к RawData 23andme.
За неимением SQL и Оracle, решил проблему дедовским способом, написав нехитрый VBA макрос, который отсеивает те SNP, которых нет в чипе 23andme. Разумеется в отличие от серверных решений, где на отсев лишних снипов из мастерлиста ХапМап (их там раза в 3 больше, чем в чипе 23ия, хотя номенклатура снипов -одинаковая Build 36) ушло бы пару минут, потратил на эту забаву около 1 часа.
На выходе получил данные по 20 лицам, данные 8 лиц из этой группы (NA06984, NA06989, NA07056, NA10850, NA11917,NA11918,NA12282,NA12283) сравнил со своими данными (test).

Результаты запуска программы Василия в режиме расчета схожести генома / калькульятора УПсов:

aisconvert -u -i data/ -cM 1 -m 100 --cg3 -z >report.txt

Цитировать

NA06984.txt test.txt 6 149 19521666 20165309 1.5
.........
NA07056.txt test.txt 6 158 155538031 156180401 1.1
NA07056.txt test.txt 6 115 150957574 151313049 1.1
..........
NA10850.txt test.txt 6 174 124374861 124986900 1.0
..........
NA11917.txt test.txt 6 205 136303100 137667613 1.9
NA11917.txt test.txt 6 153 155751623 156407665 1.1
NA11917.txt test.txt 6 109 53313906 53728022 1.1
..........
NA11918.txt test.txt 6 141 11853551 12324632 1.1
NA11918.txt test.txt 6 139 41597419 42272248 1.8
NA11918.txt test.txt 6 118 108082425 108576950 1.2
NA11918.txt test.txt 6 100 144199 517330 1.0
Similarity: 65.06%
..........

NA12282.txt test.txt 6 140 135600698 136790759 1.1
Similarity: 64.79%


Полный разбор полетов можно просмотреть в приложенном к сообщению архиве (см.вложенный файл report.txt).
« Последнее редактирование: 04 Май 2010, 03:05:04 от Vadim Verenich »

Оффлайн Anode

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Re: PLINK
« Ответ #96 : 04 Май 2010, 01:10:37 »
ага, вижу незначительный "бажок".
Надо бы выплёвывать ворнинг: когда два взаимоисключающих флага используются одновременно.
Дело в том - что программа работает либо в режиме сравнения УПСов/HIRов (-u), либо как калькулятор гомозиготности (-z), либо как конвертор в PED (по дефолту). Ежели же оба флага (-u и -z) переданы одновременно - то первый срабатывает, и -z просто игнорируется. Поэтому несмотря на то что вы передали и -z - нет репорта гомозиготности. Тот калькулятор просто не запущен при сравнении упсов. Разные modes (или процессоры, включающиеся как плагины внутри, пока взаимоискйлючающие друг друга)

Оффлайн Anode

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Re: PLINK
« Ответ #97 : 15 Май 2010, 11:22:01 »
Доступна новая версия aisconvert. Новые фичи здесь не буду дублировать (есть на сорсфордже и в топике по "однородности генома".

Линки (в том числе и скриншоты - как примитивный хелп) помещены здесь: http://forum.molgen.org/index.php/topic,889.msg43154.html#msg43154

Для айсконверта требуется жаба, но в следующей версии (если надо) можно и рантайм запаковать, обрезав по максимуму (эх, где те времена, когда была трава зе^Wжаба 6 Мегов ... не говоря о тех, когда её вообще не было ;) -- будет во много раз тяжелее чем сегодняшние 3.5 Мб, но зато тем, у кого жаба не установлена - можно будет сразу сгружать зип, раззиповывать и пользоваться.

Оффлайн Anode

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Re: PLINK
« Ответ #98 : 17 Май 2010, 09:00:49 »
Кто может сказать вкратце - сколько различных ХапМап форматов?
глаза разбегаются: какую спецификацию брать, чтобы написать конвертор из хап-мапа в формат 23андме: http://hapmap.ncbi.nlm.nih.gov/downloads/genotypes/?N=D

А то боюсь в следующие выходные нечего делать будет, если будет дождь:)
(В эти - завершил калькулятор гомозиготности: теперь точно как у Пайка, и объединение, merge, двух генотипов: aisconvert, ver0.99)


Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: PLINK
« Ответ #99 : 17 Май 2010, 11:18:05 »
Я думаю, что лучше Всего использовать данные ХапМап в формате PED
http://hapmap.ncbi.nlm.nih.gov/downloads/genotypes/hapmap3_r3/

Оффлайн napobo3Автор темы

  • Сообщений: 1257
  • Страна: il
  • Рейтинг +348/-2
  • Y-ДНК: J-FGC5231
  • мтДНК: N1b2
Re: PLINK
« Ответ #100 : 17 Май 2010, 11:36:56 »
Кто может сказать вкратце - сколько различных ХапМап форматов?
глаза разбегаются: какую спецификацию брать, чтобы написать конвертор из хап-мапа в формат 23андме: http://hapmap.ncbi.nlm.nih.gov/downloads/genotypes/?N=D

А то боюсь в следующие выходные нечего делать будет, если будет дождь:)
(В эти - завершил калькулятор гомозиготности: теперь точно как у Пайка, и объединение, merge, двух генотипов: aisconvert, ver0.99)
Предлагаю не использовать термин "формат 23андме". Если нет устоявшегося термина, можно использовать "формат RCPG" (RSID-Chromosome-Position-Genotype).
Objections?

Оффлайн Anode

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Re: PLINK
« Ответ #101 : 17 Май 2010, 18:37:48 »
Предлагаю не использовать термин "формат 23андме". Если нет устоявшегося термина, можно использовать "формат RCPG" (RSID-Chromosome-Position-Genotype).
Objections?
ну что, тогда будем пиарить/вводить новый термин RCPG-формат?
альтернативы:
RCPG, SCPA, SCPG
(от, может быть, даже более лёгкого запоминания Snip, и Allele - вместо RSID и Genotype).

Есё вариант - Base, вместо Genotype/Allele (SCPB, RCPB).

Генетики, что чаще всего используется и проще будет в запоминании?

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: PLINK
« Ответ #102 : 04 Июнь 2012, 12:08:20 »
Уважаемый Anode,
можете ли подсказать - есть ли понятная для "чайников" альтернатива PLINK для фазирования raw data.
Я пытаюсь проделать следующее: у меня есть несколько наборов данных по ближайшим родственникам (некоторые под 23иЯ, некоторые - под ФФ). В каком софте я смогу самостоятельно их фазировать для загрузки на GEDmatch.
К сожалению, после ухода Вадима с форума отвечать на такие вопросы стало некому:(
Тема где эти вопросы накопились здесь: Фазирование данных 23иЯ и FTDNA.

Оффлайн Anode

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Re: PLINK
« Ответ #103 : 04 Июнь 2012, 19:56:10 »
Уважаемый Anode,
можете ли подсказать - есть ли понятная для "чайников" альтернатива PLINK для фазирования raw data.
Я пытаюсь проделать следующее: у меня есть несколько наборов данных по ближайшим родственникам (некоторые под 23иЯ, некоторые - под ФФ). В каком софте я смогу самостоятельно их фазировать для загрузки на GEDmatch.
К сожалению, после ухода Вадима с форума отвечать на такие вопросы стало некому:(
Тема где эти вопросы накопились здесь: Фазирование данных 23иЯ и FTDNA.

Уважаемый Шад!
Я фазированием вообще не занимался.
Вопрос таки к Вадиму.

Оффлайн Шад

  • Главный модератор
  • *****
  • Сообщений: 6334
  • Страна: ru
  • Рейтинг +1330/-4
  • Ex oriente lux
  • Y-ДНК: Q-Y2750
  • мтДНК: J1c2z
Re: PLINK
« Ответ #104 : 04 Июнь 2012, 20:17:44 »
Вопрос таки к Вадиму.

Увы!


 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.