Формат nexus (*.nex) допускает синонимию. Если для некоторого таксона некоторый признак имеет несколько значений, это можно записать в скобках: (1,2,4) -- в данном таксоне признак одновременно принимает значения 1, 2 и 4. Английское наименование таких признаков: polymorphic characters.
Вопрос: как именно их обрабатывают программы типа SplitsTree, MrBayes, TNT.
В документации к SplitsTree и TNT я вроде ничего не нашел.
В
мануале MrBayes сказано загадочно: «Like most other statistical phylogenetics programs, MrBayes effectively treats polymorphism and uncertainty the same way (as uncertainty)». А как тогда обрабатывается «uncertainty»?
В документации PAUP* (раздел Maximum Parsimony) говорится о трех режимах обработки таких синонимичных значений: uncertain (default), variable, and polymorphic. Но не объясняется, какие же именно механизмы применяются.
Поясню на лингвистическом примере. В среде Starling (созданной, в частности, для языковой филогении) если в каком-либо лексическом признаке (сводешевском слове) у какого-либо языка имеется синонимия (напр., в английском для признака MANY два равноправных синонима: many и a lot of), то при сравнении двух языков внутри этого признака сравниваются все возможные пары. Если хотя бы одна пара тождественна, это засчитывается как совпадение по данному признаку.
Напр. мы сравнивает английский с исландским. В признаке MANY у английского два значения: (many,a lot of), у исландского одно значение: margur. Мы сравниваем сначала «many» с «margur», потом «a lot of» с «margur». Выясняем, что хотя бы одна пара (в данном случае many / margur) этимологически тождественна. Значит по признаку MANY английский читается совпадающим с исландским.
Т.е. для Старлинга включаем мы англ. "a lot of" во входную матрицу или не включаем -- результат сравнения с исландским будет одинаковым.
А как это дело интерпретирует биологический софт?