У меня есть стандартный набор данных по цене дома по имени df, где я определил категориальные признаки, как показано ниже:
categorical_features = [feature for feature in data.columns if data[feature].dtype=="O"]
Теперь я делаю это:
for feature in categorical_features:
temp = data.groupby(feature)['SalePrice'].count() / len(data)
temp
, что дает мне это :
Abnorml 0.069178
AdjLand 0.002740
Alloca 0.008219
Family 0.013699
Normal 0.820548
Partial 0.085616
Name: SalePrice, dtype: float64
Что я не могу понять, так это то, как count()
работает в тандеме с groupby()
?