Как визуализировать распределение объектов в каждом StratifiedKFold - PullRequest
0 голосов
/ 16 февраля 2019

Я хочу визуализировать распределение каждого объекта на сгиб, чтобы проверить, все ли сгибы имеют примерно репрезентативное распределение друг друга.

Пока что я использую этот код из существующего учебного пособия, но не знаю, как найти функции в каждом наборе и построить распределение без перебора результатов для каждого сгиба.

rf = RandomForestRegressor(n_estimators = 100, random_state = 42)
from sklearn.model_selection import StratifiedKFold
cv = StratifiedKFold(n_splits=3, random_state=42, shuffle=True)
for train_index, test_index in cv.split(features, labels):
    print("Train Index: ", train_index, "\n")
    print("Test Index: ", test_index)
    X_train, X_test, y_train, y_test = features[train_index],
features[test_index], labels[train_index], labels[test_index]         
    rf.fit(X_train, y_train)

Для каждого сгиба я хотел бы вывести гистограмму для каждого объекта за сгиб (например, 5 объектов = 5 гистограмм за сгиб).

Любая информация о том, как это сделать, будет полезна.

...