Начал писать, нечто подобное, функции поиска матчей в YSearch.
Затык на алгоритмах Левенштейна, и Хэмминга
Решил реализовать с помощью k-dimensional tree.
Нужен совет наших уважаемых математиков, правилен ли выбор алгоритма для нахождения подобных последовательностей строк? Естес-но приветствуется минимализация расхода вычислительных ресурсов.
Пока вышло сыровато, но прогресс есть
Заценить можно из
меню поискаКогда нашли нужный гаплотип, справа увидим ссылочку "Demo!!!", жмем, и получаем 100 самых близких, к заданному, гаплотипа.
Осталась одна проблемка, отсутствующий, в сравниваемом гаплотипе, маркер, дефолтно считается _совпавшим_, поэтому в самые близкие матчи вылазят короткие гаплотипы. Что с этим делать, подумаю чуток после, сейчас голова лопается )))
ПС Кому лень искать гаплотипы через поиск - прямая ссылка на
матчи для 211347-Kotwicki