Вычистил все ошибочные ячейки. Палиндромы отключил. Тем не менее, баг повторяется - расчёт не выполняется
В логах вижу 4 раза новую ошибку
/ymeter/utils.py:44: DtypeWarning: Columns (3) have mixed types. Specify dtype option on import or set low_memory=False.
которая происходит в самом начале работы в строке:
df = pd.read_csv(StringIO(csv), sep=',', header=None, names=ftdna_strs_order, index_col=0)
Ругается на нарушение формата ввода - в одной колонке (#3, т.е. DYS19, кажется) встретились и число, и слово (123cd и "12" это слова, а не числа). Попробовал воспроизвести - не получается: нужно больше данных о том, какие галки поставлены и что за данные отправляются
UPD: Кажется, причина та же - палиндромы в типично одиночных маркёрах. Просьба прописать отключение всех палиндромов (а не только DYS385, DYS459, YCAII, CDY, DYF395S1, DYS413, DYS464. палиндромит иногда DYS19, DYS425 и др.)
Не, такая палиндромность устраняется стабильно, но на более позднем этапе - тут даже прочитать входные данные не удалось.
Опцию "Ограничить ответ только N ближайшими образцами (0 - без ограничений)" заменить на "Ограничить ответ образцами с дистанцией не менее... (0 - нулевая дистанция)". Если делать как есть (оставлять 0, то система перебирает и упорядочивает всю многотысячную выборку от ближнего к дальнему)
Т.е. хотите, чтобы оставлялись не N ближайших, а те, кто имеет менее N отличающихся маркеров? Звучит осмысленно - FTDNA тоже не показывает на 12 маркерах совпаденцев, отличающихся более чем на 1 (кажется) маркер. Могу попробовать сделать.