АвторТема: Самая нужная статья в RJGG  (Прочитано 11619 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Овод

  • Главный модератор
  • *****
  • Сообщений: 1769
  • Рейтинг +390/-3
  • Omnia mea mecum porto
  • Y-ДНК: R1a-M198
  • мтДНК: U4a
Re: Самая нужная статья в RJGG
« Ответ #15 : 06 Май 2011, 21:41:16 »
Перенёс дальнейшее обсуждение в раздел "Филогения и кладистика".

Оффлайн FarroukhАвтор темы

  • Maternal Y-DNA: R1b-BY124371
  • ...
  • Сообщений: 17073
  • Страна: az
  • Рейтинг +5885/-17
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Re: Самая нужная статья в RJGG
« Ответ #16 : 25 Май 2011, 12:26:30 »
Ну-с, таки шо? Что скажет Валерий?

Оффлайн Valery

  • Сообщений: 10101
  • Страна: 00
  • Рейтинг +1374/-7
  • Ultimate Matriarchy
Re: Самая нужная статья в RJGG
« Ответ #17 : 25 Май 2011, 12:47:07 »
Дорогой Фаррух, дело в том что на самом деле много филогенетических программ в практической жизни не требуется. Хватит одной-двух на кажды популярный метод (парсимония, Байес, ML). Для парсимонии это вполне может быть ТНТ + скажем ПАУП или МакКлейд, и в скорости работы эвристик Мурка заметно отстает от всех их. У меня пока нет ни времени ни квалификации, скажем честно, сделать Мурку лидером хотя бы в одной узкой нише, хотя бы под-нише, выразимся так. Если я сумею ее допилить до этого уровня, то конечно снабжу подобающим мануалом. Пока думаю это преждевременно.

Оффлайн FarroukhАвтор темы

  • Maternal Y-DNA: R1b-BY124371
  • ...
  • Сообщений: 17073
  • Страна: az
  • Рейтинг +5885/-17
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Re: Самая нужная статья в RJGG
« Ответ #18 : 25 Май 2011, 15:13:44 »
Валерий, я это всё прекрасно понимаю. И поэтому предлагаю следующее: мы как-нибудь пересечёмся, вы берёте Ваш любимый ноутбук с дистрибутивом Мурки. Далее мы правильно её инсталлируем, прогоняем на одном конкретном примере, а уж потом на основании этого я сваяю чайниковый гапломануал.

Оффлайн Valery

  • Сообщений: 10101
  • Страна: 00
  • Рейтинг +1374/-7
  • Ultimate Matriarchy
Re: Самая нужная статья в RJGG
« Ответ #19 : 25 Май 2011, 15:51:16 »
вы берёте Ваш любимый ноутбук

у меня нету :)

Оффлайн Аббат Бузони

  • ...
  • Сообщений: 19863
  • Страна: ru
  • Рейтинг +1812/-60
  • Y-ДНК: I1-SHTR7+
  • мтДНК: H16-a1-T152C!
Re: Самая нужная статья в RJGG
« Ответ #20 : 25 Май 2011, 16:08:55 »
Найти ноут не проблема.

Оффлайн Каржавин

  • ...
  • Сообщений: 1798
  • Рейтинг +144/-2
Re: Самая нужная статья в RJGG
« Ответ #21 : 25 Май 2011, 16:51:46 »
Найти ноут не проблема.
Фаррук - молодец! Великое дело для всех хочет сделать. Валерий, не отказывайтесь!! Потом ведь этот мануал можно потихоньку дорабатывать. Главное, что будет для этого фарруковская основа.

Оффлайн Anode

  • Группа N
  • *
  • Сообщений: 1423
  • Страна: ca
  • Рейтинг +147/-0
  • PS1 -> TT1 -> EE1 -> PS2
  • Y-ДНК: N1c1
  • мтДНК: H10a1, U5b1
Re: Самая нужная статья в RJGG
« Ответ #22 : 25 Май 2011, 18:19:32 »
Уважаемый Валерий, если когда-нибудь захотите портировать мурку на джаву или на си (насчёт преимущества последнего по сравнению с первым можно подискутировать) - может быть, я мог бы найти время по вечерам и выходным (пока я не знаю объёма задачи). Как программу-максимум на будущее можно наваять и любой сложности ГУИ, графические представления графа, дерева итд.
Фреймвок масштабируемой обработки любого количества файлов в разных комбинациях, ГУИ, аргументы итд можно взять у aisconvert (выпилив оттуда, и обозвав новый форк муркой-2) либо же расширить aisconvert как генетический тулкит, сохранив трейдмарк "Мурка".

Я совершенно не знаком с Муркой, но мне кажется, процессинг можно было бы переписать один к одному из существующего сорса (если бы был код а лучше если вы кто разъяснил на пальцах - что есть что, какие коэффициенты в какие полиномы подставлять).
Подобной работой я много занимался на работе. Например, в тулах, оформленных примерно как aisconvert, с гуёй правда, вместо процессинговой функции - я поставлял разные бизнес логики, полученные до этого в виде сырцов (макросов) SAS. Ресёрчеры ваяли регрессию, находили коэффициенты на SASах, делали математику, а мне передавали найдённые коэффициенты в виде многочисленных таблиц, а я просто портировал те макры (кучи полиномов) в другой язык (джаву или си). Правда, всегда просил на пальцах объяснить/описать или написать псевдо-код: что есть что. На последнее нужно время специалиста домена (если программер сам не влезает в статьи и тонкости вычислений). Получались калькуляторы, делающие предсказания по конкретным вводам (регрессия), тулы для планирования. Что для меня не сильно отличается от того что делают в филогении. Была бы модель хорошо расжёвана, а код наваяем.

Конечно, было бы интерсно въехать в саму науку (в HIRы я благодаря парово3у когда-то въехал, в PEDы - благодаря I2a2a, а вот филогению ещё не трогал, и даже в статьи уважаемых Адамова и Каржавина, к стыду своему, пока глубоко не вчитывался, всё переношу на светлое будущее). Но так как время - сильно ограниченных ресурс - то можно бы было использовать уже готовые наработки, распараллелив задачи (а я - как алгоритмист и кодер - только тупо вбиваю коэффициенты и полиномы в алгоритмы, которые подбираю из соображений машинной памяти вида входных данных итд, и в код).

Это так, идея на будущее - если подобное переписывание Мурки вообще имеет смысл. Или, быть может, другой какой тул захотим понаписать.

Оффлайн Centurion

  • 100% Earth (Solar System) genofond
  • Администратор
  • *****
  • Сообщений: 9548
  • Страна: ru
  • Рейтинг +571/-2
Re: Самая нужная статья в RJGG
« Ответ #23 : 25 Май 2011, 18:29:07 »
мы как-нибудь пересечёмся, вы берёте Ваш любимый ноутбук с дистрибутивом Мурки
В Баку?  :o

Оффлайн wertner

  • ...
  • Сообщений: 1332
  • Страна: ru
  • Рейтинг +321/-0
    • YFull
  • Y-ДНК: E-V13->E-S2972->E-Z16661
  • мтДНК: U4a (xU4a3)
Re: Самая нужная статья в RJGG
« Ответ #24 : 25 Май 2011, 20:05:08 »
Уважаемый Валерий, если когда-нибудь захотите портировать мурку на джаву или на си (насчёт преимущества последнего по сравнению с первым можно подискутировать) - может быть, я мог бы найти время по вечерам и выходным (пока я не знаю объёма задачи). Как программу-максимум на будущее можно наваять и любой сложности ГУИ, графические представления графа, дерева итд.
Фреймвок масштабируемой обработки любого количества файлов в разных комбинациях, ГУИ, аргументы итд можно взять у aisconvert (выпилив оттуда, и обозвав новый форк муркой-2) либо же расширить aisconvert как генетический тулкит, сохранив трейдмарк "Мурка".

Я совершенно не знаком с Муркой, но мне кажется, процессинг можно было бы переписать один к одному из существующего сорса (если бы был код а лучше если вы кто разъяснил на пальцах - что есть что, какие коэффициенты в какие полиномы подставлять).
Отличная мысль. Думаю, язык на котором делать ГУИ совершенно не важен. Разве что, думаю для Валеры важна кроссплатформенность :)
Процессинг переписывать не надо: Мурка написана так (как я понял), что ее легко вызывать из другой программы. Я всё собирался написать интерфейс, но руки пока не дошли и в ближайшие месяцы не дойдут.

Оффлайн mouglley

  • ...
  • Сообщений: 7105
  • Страна: hr
  • Рейтинг +434/-7
  • Я знаю, что познаю всё.
    • Записки Маугли
  • Y-ДНК: N1c1-L1025
  • мтДНК: J1c3
Re: Самая нужная статья в RJGG
« Ответ #25 : 25 Май 2011, 21:03:34 »
Не забывайте возможность запуска 64-х рядного варианта Мурки через ГУИ.

Оффлайн Valery

  • Сообщений: 10101
  • Страна: 00
  • Рейтинг +1374/-7
  • Ultimate Matriarchy
Re: Самая нужная статья в RJGG
« Ответ #26 : 26 Май 2011, 00:29:55 »
Мне даже стыдно что столь третьесортный продукт как Мурка заслужил внимания уважаемой публики :) В общем, с ней мне предстоит еще работать и работать. Ну зачем делать красивый фантик для совершенно несъедобной конфетки?

Нет, я отнюдь не хочу сказать, что типа говну товарный вид не нужен а хорошая весчь и так своего потребителя найдет :) Это ложная и крайне самонадеянная посылка. Все мы знаем например печальный пример одной культовой серверной железки 90х гг которую разработала небезызвестная компания из 3х букв, директор которой наивно недооценивал нужность хорошего маркетинга. Но это была действительно весчь, state of art. Может я излишне строг к себе, но все-таки силы человечества лучше направлять на уже проверенные временем изобретения,а не на сомнительные поделки, типа моей Мурки. Самый правильный подход имхо у ув. Овода - он досконально изучил лучшую из программ - ТНТ - и использует по полной ее скриптовые фичи. Если в ней изначально чего и нет, то это легко дописать скриптом. Другие программы просто не нужны. Ведь задача - это не шашечки как писал один академик, уже не припомню фамилии, а ехать.

Оффлайн Valery

  • Сообщений: 10101
  • Страна: 00
  • Рейтинг +1374/-7
  • Ultimate Matriarchy
Re: Самая нужная статья в RJGG
« Ответ #27 : 26 Май 2011, 00:39:14 »
Цитировать
если подобное переписывание Мурки вообще имеет смысл

я боюсь, что мне предстоит еще не одно ее переписывание прежде чем на нее вообще следует начать обращать внимание :)

Оффлайн I2a1a

  • ...
  • Сообщений: 10364
  • Страна: ee
  • Рейтинг +761/-8
Re: Самая нужная статья в RJGG
« Ответ #28 : 26 Май 2011, 00:41:35 »
Валерий, вроде бы в одной из ранних версий Мурки была прикручена ГУЯ? :)

Оффлайн FarroukhАвтор темы

  • Maternal Y-DNA: R1b-BY124371
  • ...
  • Сообщений: 17073
  • Страна: az
  • Рейтинг +5885/-17
  • Paternal Mt-DNA: M9a1b1
    • Azerbaijan DNA Project
  • Y-ДНК: E-Y37518
  • мтДНК: F2f1
Re: Самая нужная статья в RJGG
« Ответ #29 : 26 Май 2011, 10:26:18 »
Короче, ситуация такая. Я специально прилетаю из ада Азербайджана для того чтобы внедрниться в банду "Чёрная кошка" написать мануал к Мурке. Пока что прогой владеет Горбатый Валерий - главарь гаплобанды разработчик, а также Левченко - Маугли. Я предлагаю объединить усилия и совместно допилить мурку до товарного вида. Мануалы для гаплопоциентов по азам ДНК-генеалогии уже есть, предиктор тоже есть, остаётся мануал к древостроительной проге.

Теперь по серьёзу. Мурка имеет ряд неоспоримых достоинств:
- метод, заложенный в программе, весьма близок к истине (испробовано на расчёте ВБОПа клана Саваров)
- наглядное древо с указанием ВБОПов всех ветвей и узлов, а также их характерных значений маркёров

Именно поэтому она заслуживает похвалы и применения.
« Последнее редактирование: 26 Май 2011, 11:44:27 от Farroukh »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.