Гистограмма панд игнорирует неверные данные;предел х-диапазона - PullRequest
0 голосов
/ 07 мая 2019

У меня есть фрейм данных, который состоит из комбинации текстовых и числовых данных, с некоторыми значениями -999, представляющими отсутствующие или недействительные данные. В качестве примера игрушки, скажем, это выглядит так:

import pandas as pd
import matplotlib.pyplot as plt

dictOne = {'Name':['First', 'Second', 'Third', 'Fourth', 'Fifth', 'Sixth', 'Seventh', 'Eighth', 'Ninth'],
           "A":[1, 2, -3, 4, 5, -999, 7, -999, 9],
           "B":[4, 5, 6, 5, 3, -999, 2, 9, 5],
           "C":[7, -999, 10, 5, 8, 6, 8, 2, 4]}
df2 = pd.DataFrame(dictOne)

df2.hist('C', bins = 1000)
plt.xlim=([0, 10])

Это дает enter image description here

Я пытаюсь исключить значения -999. Есть ли простой способ сделать это в Пандах?

Кроме того, в моем примере кода, почему ось X не ограничена диапазоном [0,10]?

Ответы [ 2 ]

1 голос
/ 07 мая 2019

Вместо bins=1000 вы можете указать

df2.hist('C', bins=range(0,10))

Или, если вы хотите выровнять поля гистограммы посередине:

df2.hist('C', bins=np.arange(0.5,11,1))

Выход:

enter image description here

0 голосов
/ 07 мая 2019

df2[df2['C'] > -999].hist('C') будет достаточно для всех ваших целей.Указывать 1000 контейнеров не обязательно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...