Я использую Python 3 и Pandas для проекта по науке о данных. Однако у меня есть некоторые проблемы с синтаксисом панды.
Код ниже делает что-то близкое к тому, что я хочу:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('breast-cancer-wisconsin.data.txt')
print (df.groupby('class').describe())
Я получил данные о раке молочной железы по ссылке . Конкретный файл с данными, которые я использую: breast-cancer-wisconsin.data
.
Возвращает:
bland_chrom \
count mean std min 25% 50% 75% max
class
2 458.0 2.100437 1.080339 1.0 1.0 2.0 3.0 7.0
4 241.0 5.979253 2.273852 1.0 4.0 7.0 7.0 10.0
clump_thickness ... unif_cel_shape unif_cel_size \
count mean ... 75% max count
class ...
2 458.0 2.956332 ... 1.0 8.0 458.0
4 241.0 7.195021 ... 9.0 10.0 241.0
mean std min 25% 50% 75% max
class
2 1.325328 0.907694 1.0 1.0 1.0 1.0 9.0
4 6.572614 2.719512 1.0 4.0 6.0 10.0 10.0
[2 rows x 72 columns]
Тем не менее, это не полный вывод. Три последовательные точки ...
указывают, что некоторые вещи скрыты из-за усечения.
Как я могу получить полный результат?
Спасибо.