Описание (include = 'all') не предоставляет все возможности при попытке использовать столбец в кадре данных. Может кто-нибудь объяснить, что мне здесь не хватает? - PullRequest
0 голосов
/ 13 сентября 2018

Я загрузил набор данных iris как csv. Мой набор данных выглядит так -

data.head()
    0   1   2   3   4
1   5.1     3.5     1.4     0.2     Iris-setosa
2   4.9     3   1.4     0.2     Iris-setosa
3   4.7     3.2     1.3     0.2     Iris-setosa
4   4.6     3.1     1.5     0.2     Iris-setosa
5   5   3.6     1.4     0.2     Iris-setosa

Если я попытаюсь описать это

data.describe(include='all')
    0   1   2   3   4
count   150     150     150     150     150
unique  35  23  43  22  3
top     5   3   1.5     0.2     Iris-virginica
freq    10  26  13  29  50

Я пытался преобразовать их в числовой тип, думая, что тип данных "str", он рассматривает их как категориальные.

data.iloc[:,0:4] = data.iloc[:,0:4].apply(pd.to_numeric)

Но я все еще получаю те же результаты. Почему среднее, стандартное значение, процентиль и т. Д. Не отображаются? Я также попытался использовать функцию description только для столбца, но безрезультатно.

data1 = data.loc[:,0]
print(data1)
print(type(data1))
data1.describe(include=['O'])

148    6.5
149    6.2
150    5.9
Name: 0, Length: 150, dtype: object
<class 'pandas.core.series.Series'>

count     150.0
unique     35.0
top         5.0
freq       10.0
Name: 0, dtype: float64

Что мне здесь не хватает?

...