А каким программным продуктом вы пользуетесь? А сама программа - ваша разработка?
сегодня с программными ошибками боролся
Здравствуйте, Денис
Чтобы написать статью, мне пришлось разработать следующие алгоритмы и провести соответствующий цикл исследований:
- имитатор гапллотипов по заданным параметрам, а именно, скорость мутации в маркере, среднее количество мутаций, накопленное за заданный интервал времени и пр.
- проверка по различным статистическим критериям (хи-квадрат, Романовского) соответствия реальной гистограммы аллелей и их ее теоретической аппроксимации, формирование которой пришлось встроить в общий алгоритм проверки.
- расчет максимально правдоподобной оценки модального гаплотипа и времени до первопредка по совокупности гаплотипов. Это основной расчетный алгоритм, который желательно, чтобы все использовали.
- расчет максимально правдоподобной оценки времени, прошедшего от первопредка, до единственного проверяемого гаплотипа (оценка времени "жизни" гаплотипа археологических останков). Это второй расчетный алгоритм, который, по мере совершенствования технологии секвенирования и накопления археологически добытых ДНК, будет иметь все бОльшее значение.
- алгоритм статистического моделирования большой совокупности гаплотипов и расчета качества максимально правдоподобных оценок (модального гаплотипа и времени до первопредка), а именно, смещенности, состоятельности, доверительные интервалы и пр.
Для 2-й части статьи приходится полностью повторять, причем, три алгоритма из вышеперечисленных практически новые (под новый алгоритм).
Здесь сразу хотелось бы сказать следующее. Во множестве статей изложены различные статистические методы (и их модификации), используемые в ДНК-генеалогии, но нигде серьезно не рассмотрены вопросы качества получаемых оценок, которые стандартно и обязательно должны проводиться (по крайней мере,ю мне такие публикации не попадались). Эту скучную и нудную работу никто не хочет делать. А ведь это крайне необходимо. Не зря столько сил столпы статистической науки потратили на разработку этих вопросов.
Если Вы посмотрите на мою статью под этим углом зрения, то увидите, что менее 50% посвящено модели, конкретным результатам, а остальное - это проверки, проверки, оценки качества вычислительных процедур и пр. А иначе нельзя! Именно здесь, "как и положено", после первой публикации оказались все проблемы, и огромное спасибо уважаемым А.Клесову, Nimissin'у, Князю Игорю (rodstvo.ru) за их критические замечания.