АвторТема: atDNAClusterer - Программное обеспечение для кластеризации совпаденцев  (Прочитано 5032 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Daemon2017Автор темы

  • Сообщений: 942
  • Страна: ru
  • Рейтинг +271/-6
  • Y-ДНК: R1a-Y35177/BY89957
  • мтДНК: V7a1
Вот собственно картинка. Один кластер это выделенное красным, а второй - синим, не так ли?


Остальное все понял)

Да, все так :)

Оффлайн gecube_ru

  • Сообщений: 985
  • Страна: ru
  • Рейтинг +156/-0
  • Незнайка на Луне
  • Y-ДНК: I-A6397
  • мтДНК: V7a1?
Первое. И самое важное - прибейте, пожалуйста, ссылку на утилиту в самый первый пост.
Второе. Как программист советую, не выкладывайте исполняемые файлы в github. Почему? Потому что они будут полностью перезалиты при следующем изменении. Репозиторий хорош тем, что он хранит исходную версию текстового файла + изменения к нему, что достаточно компактно. Т.е. условно имеем файл 10КБ и каждая итерация в него добавляет 1КБ текста. Скажем, 10 итераций (коммитов). Итог = 10КБ + 1*10КБ = 20КБ
Если же этот файл будет бинарный, то он будет перезалит и размер репы увеличится на 10*11=110КБ. При маленьких файлах это не беда... Но если они будут расти, то беде скоро быть. Ну, и если Вы все-таки решите файлы убрать из репозитория, то без того, чтобы его "попортить" это невозможно. Т.е. если кто-то его форкнул, то репозитории разойдутся - и опять беда. Поэтому лучше сразу делать по-нормальному. В интернете куча мануалов как с этим бороться. В конце-концов, можно бинари грузить на sourceforge....
Третье. Было бы очень круто, если программа будет работать на Линукс без допиливания. И была бы написана на Питоне )))) Меня удивило, но даже на полностью обновленной винде 10 она потребовала .NET 4.6.2. Это не то, чтобы плохо.... Просто данность. И лучше без этого фреймворка обходится (или хотя бы - более младшей версией)...
« Последнее редактирование: 22 Январь 2017, 23:13:32 от gecube_ru »

Оффлайн gecube_ru

  • Сообщений: 985
  • Страна: ru
  • Рейтинг +156/-0
  • Незнайка на Луне
  • Y-ДНК: I-A6397
  • мтДНК: V7a1?


Как это трактовать? Черные, зеленые и синие - финны. Красные - все остальные (русские, англичане итп).

Второй вариант того же самого:



Картинка сама не меняется, меняется разбивка по цветам. Такой же эффект, шаманить с кол-вом кластеров.


И четвертое замечание - в программе не хватает прогресс-баров на затратных по времени операциях (загрузка данных, обработка).

Оффлайн Daemon2017Автор темы

  • Сообщений: 942
  • Страна: ru
  • Рейтинг +271/-6
  • Y-ДНК: R1a-Y35177/BY89957
  • мтДНК: V7a1
Выкатили обновление 0.1.1

Исправили беду с памятью (потребление 100+ Мб ОЗУ - перебор) и сделали удалялку сирот (совпаденцев, у которых нет связей ни с кем, кроме самого владельца кита) - вопреки нашим смелым ожиданиям это почти не изменило картину мира, но на душе стало спокойнее  ::)


Оффлайн 0leg

  • Сообщений: 1
  • Рейтинг +0/-0
Ссылка на статью в заголовке не работает, можно ли поправить?

Оффлайн Daemon2017Автор темы

  • Сообщений: 942
  • Страна: ru
  • Рейтинг +271/-6
  • Y-ДНК: R1a-Y35177/BY89957
  • мтДНК: V7a1
Ссылка на статью в заголовке не работает, можно ли поправить?

RJGG уже достаточно давно на тех. обслуживании - не знаю, когда починят.

Кажется, эта версия ничем не отличается от той, что была на сайте: https://vk.com/doc5244078_441458387?hash=db134d16fc2e059ee7&dl=ef22d944f73390a84d

Оффлайн Daemon2017Автор темы

  • Сообщений: 942
  • Страна: ru
  • Рейтинг +271/-6
  • Y-ДНК: R1a-Y35177/BY89957
  • мтДНК: V7a1
Сервер FTDNA, раздающий данные, временно не работает.
Выпустили обновление, которое умеет обрабатывать такое событие, а не просто падать с ошибкой. Ну и пачка небольших технических правок.
https://github.com/Daemon2017/atDNAClusterer

Оффлайн HaploAndrey

  • Сообщений: 108
  • Страна: ru
  • Рейтинг +38/-0
  • Y-ДНК: C-F4002/F1918/Z1866/F966/Y4497/F4044
  • мтДНК: J1c5a
Подскажите, сталкивался ли кто-нибудь вот с такой ошибкой, и как удалось ее исправить? программа выдает ее при после введения номера кита и пороля в FTDNA при попытке скачать данные




Оффлайн Daemon2017Автор темы

  • Сообщений: 942
  • Страна: ru
  • Рейтинг +271/-6
  • Y-ДНК: R1a-Y35177/BY89957
  • мтДНК: V7a1
Подскажите, сталкивался ли кто-нибудь вот с такой ошибкой, и как удалось ее исправить? программа выдает ее при после введения номера кита и пороля в FTDNA при попытке скачать данные




Обновите версию до последней. Сейчас сервера фтдна лежат, а мы такого не предполагали в прошлых версиях :)

Оффлайн Пересвет

  • Александр Кудрявцев
  • Сообщений: 58
  • Страна: ru
  • Рейтинг +13/-0
  • Y-ДНК: N-Y29761
Таблицу из Gedmatch не смог загрузить: ошибка http://pastebin.com/syMHH9H5, csv http://pastebin.com/5rj80FdG .
« Последнее редактирование: 28 Январь 2017, 18:24:15 от Пересвет »

Оффлайн Daemon2017Автор темы

  • Сообщений: 942
  • Страна: ru
  • Рейтинг +271/-6
  • Y-ДНК: R1a-Y35177/BY89957
  • мтДНК: V7a1
Таблицу из Gedmatch не смог загрузить: ошибка http://pastebin.com/syMHH9H5, csv http://pastebin.com/5rj80FdG .

Хм... файл сформирован правильно - у меня все открылось. А кнопки в какой последовательности нажимаете?


Оффлайн Пересвет

  • Александр Кудрявцев
  • Сообщений: 58
  • Страна: ru
  • Рейтинг +13/-0
  • Y-ДНК: N-Y29761
Файл - открыть гедматч - открыть - ошибка. Однако ваш error.csv загрузился.
Вот мой https://www.dropbox.com/sh/znalh5m9iz7gws7/AAAEWxcmlYREUeHIsOyqr2W4a?dl=0

PS В вашем файле разделитель значений - точка с запятой и десятичный разделитель - запятая.
PPS Я неверно трактовал Excel'евскую формулировку "разделитель -- запятая", стало быть, и уже нашел на хабре про эти грабли. Прошу прощения и спасибо за помощь.
« Последнее редактирование: 28 Январь 2017, 21:52:16 от Пересвет »

Оффлайн Daemon2017Автор темы

  • Сообщений: 942
  • Страна: ru
  • Рейтинг +271/-6
  • Y-ДНК: R1a-Y35177/BY89957
  • мтДНК: V7a1
Файл - открыть гедматч - открыть - ошибка. Однако ваш error.csv загрузился.
Вот мой https://www.dropbox.com/sh/znalh5m9iz7gws7/AAAEWxcmlYREUeHIsOyqr2W4a?dl=0

PS В вашем файле разделитель значений - точка с запятой и десятичный разделитель - запятая.
PPS Я неверно трактовал Excel'евскую формулировку "разделитель -- запятая", стало быть, и уже нашел на хабре про эти грабли. Прошу прощения и спасибо за помощь.

Не за что ;)

Оффлайн gecube_ru

  • Сообщений: 985
  • Страна: ru
  • Рейтинг +156/-0
  • Незнайка на Луне
  • Y-ДНК: I-A6397
  • мтДНК: V7a1?
А у меня не загрузились csv сделанные в либреофис на Линукс. Разделитель строк не тот... Блин

Оффлайн Пересвет

  • Александр Кудрявцев
  • Сообщений: 58
  • Страна: ru
  • Рейтинг +13/-0
  • Y-ДНК: N-Y29761
А у меня не загрузились csv сделанные в либреофис на Линукс. Разделитель строк не тот... Блин
В либре при сохранении можно выбирать разделители и пр. Еще быстрее пересохранения под Линукс ом будет sed.
sed -e 's/,/;/g' -e 's/\./,/g' bad.csv >  good.csv
« Последнее редактирование: 29 Январь 2017, 08:49:38 от Пересвет »

 

© 2007 Молекулярная Генеалогия (МолГен)

Внимание! Все сообщения отражают только мнения их авторов.
Все права на материалы принадлежат их авторам (владельцам) и сетевым изданиям, с которых они взяты.


Rambler's Top100