У меня есть два числовых c массива одинаковой длины, причем один массив всегда имеет значение элемента> = для соответствующего (того же индекса) элемента во втором массиве.
Я пытаюсь визуализировать в один график:
i) разница между соответствующими элементами,
ii) значения соответствующих элементов в двух массивах.
Я попытался построить CDF, как показано ниже:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
arr1 = np.random.uniform(1,20,[25,1])
arr2 = arr1 + np.random.uniform(1,10,[25,1])
df1 = pd.DataFrame(arr1)
df2 = pd.DataFrame(arr2)
fix, ax = plt.subplots()
sns.kdeplot(df1[0], cumulative=True, color='orange', label='arr1')
sns.kdeplot(df2[0], cumulative=True, color='b', label='arr2')
sns.kdeplot(df2[0]-df1[0], cumulative=True, color='r', label='difference')
plt.show()
, который дает следующий вывод:
Тем не менее, он не отражает разницу, а значения соответствующих элементов вместе. Например, предположим, что разница между двумя элементами равна 3. Два числа могут быть 2 и 5, но они также могут быть 15 и 18, и это не может быть определено из CDF.
Какой тип построения графика может визуализировать как разницу между элементами, так и значения элементов?
Я не буду sh изображать линейный график, как показано ниже, потому что не так много статистических выводов выведено из визуализации.
ax.plot(df1[0])
ax.plot(df2[0])
ax.plot(df2[0]-df1[0])