Можно ли чуть подробнее про три последних столбца:
Frequency in the database - это, видимо, встречаемость мутации в выборке?
Frequency after applying phylogenetically-motivated corrections - а это что за коррекция?
Number of related changes on the Tree - а это встречаемость мутации в узлах дерева? И если поделить каждое значение на медиану по всем мутациям, то мы получим оценку филогенетической значимости мутации? Может быть, имеет смысл делить на максимальное значение, чтобы оценка была от 0 до 1?
Frequency in the database - да, встречаемость, но в сырых данных
Frequency after applying phylogenetically-motivated corrections - лучше брать эту, тк это результат правки, устранения фантомов и поиска пропущенного авторами
Number of related changes on the Tree - число переходов с этой мутацией, узлов будет больше, тк мутация будет сидеть у всех потомков если только у кого не обратится вспять
Вопрос как нормировать последнюю колонку - сейчас посмотрел, что когда я писал тот камент, то забыл какое там значение. Коли там не частота в базе, а число переходов - да, на максимум, конечно, спс за поправку))