Как я могу найти количество ячеек в фрейме данных, которые попадают в пределы погрешности c? - PullRequest
0 голосов
/ 08 июля 2020

Прямо сейчас у меня есть фрейм данных под названием «сравнение» (в Python Pandas) с двумя столбцами: «Фактическое значение» и «Прогнозируемое значение». Моя цель - создать распределение ошибок в данных. Другими словами, я хочу знать, какая доля «Прогнозируемых значений» попадает в пределы погрешности 5% от «Фактического значения», а затем повторить с 4%, 3% ... полностью до 1% и создать какое-то графическое представление.

Я попытался создать другой фрейм данных (названный «marginsdf»), который показывает, попадает ли каждое «прогнозируемое значение» в заданную ошибку для его «фактического значения»:

marginsOfError = [-0.05, -0.04, -0.03, -0.02, -0.01, 0.01, 0.02, 0.03, 0.04, 0.05]
marginsdf = pd.DataFrame()
for x in range(len(marginsOfError)):
    margin = marginsOfError[x]
    if margin < 0:
        marginsdf[str(margin)] = comparison["Predicted Value"] >= (1 + margin) * comparison["Actual  Value"]
    else:
        marginsdf[str(margin)] = comparison["Predicted Value"] <= (1 + margin) * comparison["Actual Value"]

Однако я пришел к выводу, что это не идеально, так как я бы предпочел не различать отрицательную / положительную границу ошибки. Есть ли лучший способ решить эту проблему?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...