У нас есть фрейм данных с отсортированным индексом с плавающей запятой и двумя столбцами, которые должны быть одинаковыми. Их значения не всегда присутствуют, и в худшем случае они не имеют перекрытий в значениях индекса. Цель состоит в том, чтобы иметь возможность проверить, как далеко они друг от друга.
Я думал о том, чтобы интерполировать пропущенные значения и затем вычислить расстояние. Это приведет к большому набору значений индекса, для которых можно рассчитать это расстояние.
Другим подходом было бы сравнение фактических значений и определение ошибки индекса, для которой это сравнение имело бы смысл.
Вопрос в том, какой подход имеет больше смысла и как рассчитать расстояние. Результат должен сказать нам, насколько они близки друг к другу, например. 0
означает, что они одинаковы.
Пример
У нас есть фрейм данных с двумя столбцами a1
и a2
и отсортированный индекс с плавающей запятой.
df = pd.DataFrame({'a1':[6.1, np.nan, 6.8, 7.5, 7.9],
'a2':[6.2, 6.6, 6.8, np.nan, 7.7]},
index=[0.10, 0.11, 0.13, 0.16, 0.17])
a1 a2
0.10 6.1 6.2
0.11 NaN 6.6
0.13 6.8 6.8
0.16 7.5 NaN
0.17 7.9 7.7