Имеется в виду вес, назначаемый мутациям редких типов? Как его рассчитать?
да, поскольку минимум гомоплазии - это по сути редкость мутации, то можно так назвать
вариантов реально много и для выбора приемлемого нужны тесты
отправной вариант - вообще без филогенетики, просто по матрице данных
но сначала признаки надо сделать полностью определенными, запустив какой-то вариант филогении и построив дерево, по которому восстанавливаются состояния входных таксонов где у них лакуны
допустим, лакун нет
для каждого признака считаем, с каким количеством других признаков несовместен данный
если признаки бинарны, то это просто: 2 признака несовместны тогда и т тогда, когда проекция матрицы на них имеет ВСЕ 4 состояния (00 01 10 11). Для небинарных посложнее.
соответственно как-то надо нормировать потом, линейно или иным образом, чтобы превратить эту информацию в веса
этот простейший метод не идеален тем, что большое количество исходной гомоплазии в действительности может быть разрешено: когда есть набор хорошо ведущих себя признаков, устаканивающих топологию
поэтому более разумный вариант - генерация большого количества деревьев и подсчет для каждого признака в какой доле деревьев он вел себя плохо (мутировал обратно или параллельно)
то есть уже не попарно сравнивая признаки в таблице, а непосредственно наблюдая за каждым признаком в каждом построенном дереве
этот метод часто дает более вменяемый результат, чем первый, тк работает апостериорно с деревьями
в принципе, если в первом методе признак совместим
почти со всеми прочими, то скорее всего согласно результатам второго метода, он будет всегда хорошо себя вести на порожденных деревьях
но это таки следует проверять, для чего и нужен второй метод
то есть первый способ грубее, второй - тоньше, но они примерно про одно и то же