АвторТема: Утилита для создания усреднённого генома  (Прочитано 4639 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Утилита для создания усреднённого генома
« Ответ #30 : 30 Октябрь 2015, 19:02:56 »
Цитировать
У меня три разных файла все-таки ФТДНА нашел, у все одинаковое количество снипов, 696752 , и все csv таблицы. А вот вы прислали файл якобы ФТДНА, но уже не таблица а другое расширение было, обработанный чем-то? И у него уже 707268 снипов почему-то.
Я не пойму, файл чем-то обработанный? пришлите стандартный файл фтдна как есть прямо с сайта в архиве скаченный.

Воздержитесь от своих "якобы". Не смешите меня и людей.

Посмотрите на скриншот:



По каждому сэмплу разная длина. Даже для одного человека, по которому ошибочно две пробирки разнесли в разные тестовые наборы, но обработали в одном батче.
Задача, вынесенная в заголовок темы, в том числе и состоит в объединении таких вот двух файлов в один.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Утилита для создания усреднённого генома
« Ответ #31 : 30 Октябрь 2015, 19:07:33 »
Про расширения.
Вы что, не в курсе, что его определяет то, что написано после последней точки? Точки до этого - не в счёт.
Содержимое если Вы смогли открыть с помощью Блокнота, скажем, то и сможете в этом же самом Блокноте написать. Не забыть только про непоказываемые символы. Чтобы нужные были, а ненужные нет. (Я про знаки табуляции.)

Файлы, что Вам отослал - исходные. Просто их переименовал. Содержимое от этого не поменялось.
То что мой файл длиннее прочих - для меня очевидно. Ведь тест брал я, а не прочие. (Пардон, за всегдашюю мою заносчивость и похвальбу.)

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Утилита для создания усреднённого генома
« Ответ #32 : 30 Октябрь 2015, 19:16:03 »
Цитировать
Но вообще, как посмотрел, если ноукалл написано, название снипа все-равно стоит. Поэтому это от ноукалл не будет зависеть, хоть сколько ноукаллов будет.

Вот тут вопрос по настоящему сложный. Именно такие вопросы и объясняют, почему я ратую за открытое обсуждение. Чтобы не два человека вместе глупости говорили, а чтобы и ещё кто-нибудь походя их носом в нужное ткнул.

Про ноу-коллы.

Не уверен, что - - обозначает именно ноу-колл.
Ноу- колл я трактую, как не прочитанное значение.
А - - для меня это отсутствие нуклеотидов в позиции. То есть, один из вариантов значения.

Об этом много писалось уже. Например, во время работы над УПСомером. Но надо либо все перекопать. Либо приставать к людям с вопросами. Либо, что проще всего, посмотреть при отладке по таблицам.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Утилита для создания усреднённого генома
« Ответ #33 : 30 Октябрь 2015, 19:23:58 »
Про пишите сами.
Хорошо сказано, чёрт возьми!
Чем получать по 20 писем со зряшными вопросами, за которыми не стоит ни малейшей попытки подумать, может и в самом деле, потратить пару-тройку дней и написать всё как надо самому?
Возможно хватит и пары часов, если удастся кратким, но емким письмом заинтересовать Феликса.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Утилита для создания усреднённого генома
« Ответ #34 : 30 Октябрь 2015, 19:34:26 »
Открыл сейчас файлы Дмитрия Бади (на скриншоте второй и третий).
Две черточки, похоже, не ноу-колл, как и отписал выше: Потому как в двух файлах они идентичны. Скажем для 1 хромосомы для позиции 2358944 имеем:

Цитировать
"rs10797423","1","2358944","--"

Оффлайн SSlava

  • Сообщений: 942
  • Страна: 00
  • Рейтинг +63/-107
  • Y-ДНК: J-CTS6804
Re: Утилита для создания усреднённого генома
« Ответ #35 : 30 Октябрь 2015, 19:44:36 »
Про пишите сами.
Хорошо сказано, чёрт возьми!
Чем получать по 20 писем со зряшными вопросами, за которыми не стоит ни малейшей попытки подумать, может и в самом деле, потратить пару-тройку дней и написать всё как надо самому?
Возможно хватит и пары часов, если удастся кратким, но емким письмом заинтересовать Феликса.

А, внимательнее прочел. Ну раз знаете программирование. Пишите тогда, или пусть вам Феликс напишет.

 ;D и тут без всяких обид или всего прочего. Просто странно читать такое от того кто может и сам написать. Я бы в таком случае даже не стал бы просить о помощи так как бессмысленно и сам могу сделать как лучше, так как представлял бы что мне конкретно нужно.
Как-то это все весьма странно читать.
 ???

Я как писал программирование знаю на начальном уровне, мне тоже надо чтобы это написать пару дней например. Хотя алгоритм выглядит не сложным.
 Я умею писать только на C#, других языков не знаю.


Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Утилита для создания усреднённого генома
« Ответ #36 : 30 Октябрь 2015, 19:45:21 »
Хотя с другой стороны имеем разные варианты:

Цитировать
"rs11466694","1","1139416","CC"

и

Цитировать
"rs11466694","1","1139416","--"

Оффлайн SSlava

  • Сообщений: 942
  • Страна: 00
  • Рейтинг +63/-107
  • Y-ДНК: J-CTS6804
Re: Утилита для создания усреднённого генома
« Ответ #37 : 30 Октябрь 2015, 19:56:04 »
НУ а если хотите, чтобы написал, мне нужен четкий алгоритм действий.

Я пока только так представляю:

1) цикл перебирает все файлы и отбирает все снипы, которые в них есть и сравнивает между собой, чтобы вывести единый файл включающий в себя все снипы в этих файлах и средние значения их.

А вот дальше не понятки. Я так и не понял, как хотите чтобы она отбирала средние значения?
 ???
То про весы пишите (хотя написали только для трех значений из 9 возможных вариантов), то еще про что-то.
Программа действительно не сложная, но понять что вы именно хотите пока не представляется возможным мне)).



Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Утилита для создания усреднённого генома
« Ответ #38 : 30 Октябрь 2015, 19:57:07 »
Про пишите сами.
Хорошо сказано, чёрт возьми!
Чем получать по 20 писем со зряшными вопросами, за которыми не стоит ни малейшей попытки подумать, может и в самом деле, потратить пару-тройку дней и написать всё как надо самому?
Возможно хватит и пары часов, если удастся кратким, но емким письмом заинтересовать Феликса.

А, внимательнее прочел. Ну раз знаете программирование. Пишите тогда, или пусть вам Феликс напишет.

 ;D и тут без всяких обид или всего прочего. Просто странно читать такое от того кто может и сам написать. Я бы в таком случае даже не стал бы просить о помощи так как бессмысленно и сам могу сделать как лучше, так как представлял бы что мне конкретно нужно.
Как-то это все весьма странно читать.
 ???

Я как писал программирование знаю на начальном уровне, мне тоже надо чтобы это написать пару дней например. Хотя алгоритм выглядит не сложным.
 Я умею писать только на C#, других языков не знаю.

Друг мой,

Последний язык, который я полгода учил и на котором 8 месяцев работал (без зарплаты!!!) был именно Си шарп. Жаль, что только было это в относительно далёкие 2003-2004 гг. И после этого программирование для меня кончилось.
Могу писать - это значит, если нужда по настоящему заставит, то ринусь доставать компиляторы, вспоминать библиотеки классов и прочие утраченные навыки и напишу, конечно же.
Человеку же умелому на всё про всё понадобится долгий вечер, возможно перетекающий в бессонную ночь.
Думалось, скажу, модальный гаплотип, дарагой, знаешь? А модальный геном сделать сможешь? И кто-нибудь подсобит.
Как-то не предусматривалось, что будут задавать много простых вопросов, да ещё и чуть не дурачком обзывать. С больной головы на здоровую, так сказать.

Оффлайн SSlava

  • Сообщений: 942
  • Страна: 00
  • Рейтинг +63/-107
  • Y-ДНК: J-CTS6804
Re: Утилита для создания усреднённого генома
« Ответ #39 : 30 Октябрь 2015, 19:58:38 »
Цитировать
Друг мой,

Последний язык, который я полгода учил и на котором 8 месяцев работал (без зарплаты!!!)

 ;D никакой я вам ни друг, это раз.
И второе, раз работали в этой сфере так и тем более пишете(раз работали думаю возможно даже знаете лучше программирование), тогда я даже не хочу в это ввязываться или время тратить)).

 :) дальше после этого прочел несколько фраз и читать даже не захотел дальше, что Вы там пишете.
На этом и откланяюсь.

« Последнее редактирование: 30 Октябрь 2015, 21:50:07 от SSlava »

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Утилита для создания усреднённого генома
« Ответ #40 : 30 Октябрь 2015, 20:04:24 »
Оба файла Дмитрия Бади внутри, действительно, одинаковой длины.
В Ворде по 11423 страницы каждая. Разница, правда, в 896 слов. Но на такой длине ей можно пренебречь.
Не понятно, почему такая разница в размерах зазипованного файла. Но это не вопрос. Точнее вопрос, ответ на который особо не интересует.

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Утилита для создания усреднённого генома
« Ответ #41 : 30 Октябрь 2015, 20:09:06 »
:) дальше после этого прочел несколько фраз и читать даже не захотел дальше, что Вы там пишете.
На этом и откланяюсь.

Собственно и поэтому тоже писал в открытой ветке.
Потому с первых строк нашей переписки сразу вспомнился Вильям, брат наш, Шекспир с его из ничего и выйдет ничего.

Второе же соображение описывается анекдотом:
- Ты чего такой злой?
- Да, на соседа по общаге три часа убил.
- ?
- Объяснял ему свёртку Фурье. Раз, объяснил. Два, Десять. Уже сам понял, ну, а он ни в какую.
    :)

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Утилита для создания усреднённого генома
« Ответ #42 : 30 Октябрь 2015, 20:14:03 »
По многим -- в другом файле имеется буквенное значение.
Значит -- в качестве значения брать не надо. Не важно, ноу-колл это, или отсутствие нуклеотидов.

Оффлайн SSlava

  • Сообщений: 942
  • Страна: 00
  • Рейтинг +63/-107
  • Y-ДНК: J-CTS6804
Re: Утилита для создания усреднённого генома
« Ответ #43 : 30 Октябрь 2015, 20:18:35 »
:) дальше после этого прочел несколько фраз и читать даже не захотел дальше, что Вы там пишете.
На этом и откланяюсь.

Собственно и поэтому тоже писал в открытой ветке.
Потому с первых строк нашей переписки сразу вспомнился Вильям, брат наш, Шекспир с его из ничего и выйдет ничего.

Второе же соображение описывается анекдотом:
- Ты чего такой злой?
- Да, на соседа по общаге три часа убил.
- ?
- Объяснял ему свёртку Фурье. Раз, объяснил. Два, Десять. Уже сам понял, ну, а он ни в какую.
    :)
Ну если такие умные. за это время давным давно бы написали программу, пока со мной общаетесь. А не писали бы всякую ересь, ей богу. Или Феликс бы написал и все понял сразу бы.
 :P

Я то например в отличие от вас никогда не работал программистом и вообще на другую специальность учился, а это так хобби небольшое чуть по-разбираться было.

это я вас тогда должен о помощи просить в программировании)).

Оффлайн Mich GlitchАвтор темы

  • Genus regis
  • Сообщений: 37027
  • Страна: ca
  • Рейтинг +3757/-48
  • Y-ДНК: J2b1
  • мтДНК: H6a1a5a
Re: Утилита для создания усреднённого генома
« Ответ #44 : 30 Октябрь 2015, 20:26:12 »
А не писали бы всякую ересь, ей богу.

Цитировать
А что опять за новая ерунда?

Цитировать
хрен поймешь уже.

И т. д., и т. п., а ведь до программирования так и не дошли. Только разбирались с тем, что такое расширение файлов и что такое модальные значения.
Я собственно об этом.

Вроде идея простая. Вроде и все достоинства её реализации понятны. Вроде не важно, как и на чём человек программирует, лишь бы результат выдал.
А не вышло.

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.