df.describe () не показывает всю статистику для столбцов с большими числами - PullRequest
0 голосов
/ 12 января 2019

Я пытаюсь сгенерировать статистику (помимо прочего) для списка бигнумов, но это не работает.

import pandas as pd

# example numbers
dataset = pd.DataFrame(data=[2 ** 64, 2 ** 65, 2 ** 66], columns=['bignum'])
print(dataset.describe())

Он печатает следующую информацию, но не желаемую статистику, такую ​​как стандартное отклонение, среднее и т. Д., Как это происходит со списками меньших чисел.

                      bignum
count                      3
unique                     3
top     36893488147419103232
freq                       1

Я бы хотел сказать что-то вроде этого:

       bignum
mean      ...
std       ...
min       ...
25%       ...
50%       ...
75%       ...
max       ...

1 Ответ

0 голосов
/ 12 января 2019
dataset.dtypes

bignum    object
dtype: object

По какой-то причине ваш столбец загружается в панды как объект. Решение:

dataset.astype(float).describe()

             bignum
count  3.000000e+00
mean   4.304240e+19
std    2.817787e+19
min    1.844674e+19
25%    2.767012e+19
50%    3.689349e+19
75%    5.534023e+19
max    7.378698e+19

Приведите столбец к float, чтобы увидеть желаемую статистику.

...