К сожалению, у меня нет однозначного ответа на этот вопрос. Можно найти самое оптимальное по стоимости дерево, но нет никаких гарантий, что оно будет достоверным в генеалогическом смысле этого слова ( а именно это Вас и интересует). Что тут можно посоветовать? Тестироваться на максимальное возможное количество Y-STR маркеров и приватные SNP, затем анализировать каждое дерево с привлечением к анализу историко-географических данных.
Лично мне тестироваться, наверное, пока рано, так как я J2b2 и уже на 17 маркерах никаких приближенцев и близко не стоит. Так что 67 маркеров только сделает ситуацию более пессимистичной. Можно, конечно, на отдалённую перспективу...
Что до дерева, то хотелось бы построить пусть не достоверное, но достаточно приемлемое (и главное - наглядное) для хорошего комментария по результатам проекта. Пожалуй оптимальное по стоимости будет в самый раз, беда только, что таких best trees - определяется великое множество.
Видно, что ТНТ лучше других программ разделяет субклады, поэтому разумно будет поглубже в неё вникнуть.
Попробовал поизменять параметры обработки, некоторыми можно снизить число деревьев до 1. Например, в традиционном поиске можно отключить swapping algoritm=none (обменный алгоритм?) и при repls (числе доп. последовательностей?) до 10 - получается только одно дерево. Свыше 10 - два и более. При любом (из двух вар.) включении алгоритма - деревьев до сотни.
При ТНТ-поиске в режиме driven search (прогонном?) можно снизить число init. addseqs (начальных доп. последовательностей?) с 5 (при которых имеем 3 дерева) до 2 (одно дерево).
Верно ли будет пойти таким путём? Best score во всех случаях минимальный. Оптимальное по стоимости - это то же, что best score или что-то иное?