Получение значимых результатов из pandas .describe () - PullRequest
0 голосов
/ 19 июня 2020

Я вызвал описание для одного столбца фрейма данных и получил следующий результат:

count    1.048575e+06
mean     8.232821e+01
std      2.859016e+02
min      0.000000e+00
25%      3.000000e+00
50%      1.400000e+01
75%      6.000000e+01
max      8.599700e+04

Какой параметр передать, чтобы получить значимые целочисленные значения. Я имею в виду, когда я проверяю SQL, это около 43 миллионов. Все остальные значения также различны. Может кто-нибудь помочь мне понять, что означает это преобразование и как мне округлить число с плавающей запятой до двух знаков после запятой. Я новичок в Pandas.

Ответы [ 2 ]

1 голос
/ 19 июня 2020

Есть два способа управлять выводом pandas, либо управляя им, либо используя apply.

pd.set_option('display.float_format', lambda x: '%.5f' % x)

df['X'].describe().apply("{0:.5f}".format)
1 голос
/ 19 июня 2020

Вы можете напрямую использовать round() и передать нужное количество десятичных знаков в качестве аргумента


# importing pandas as pd 
import pandas as pd 

# importing numpy as np 
import numpy as np 

# setting the seed to create the dataframe 
np.random.seed(25) 

# Creating a 5 * 4 dataframe  
df = pd.DataFrame(np.random.random([5, 4]), columns =["A", "B", "C", "D"]) 
# rounding describe
df.describe().round(2)
    A   B   C   D
count   5.00    5.00    5.00    5.00
mean    0.52    0.47    0.38    0.42
std 0.21    0.23    0.19    0.29
min 0.33    0.12    0.16    0.11
25% 0.41    0.37    0.28    0.19
50% 0.45    0.58    0.37    0.44
75% 0.56    0.59    0.40    0.52
max 0.87    0.70    0.68    0.84

DOCS

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...