Я пытаюсь объединить недостаточную выборку данных и передискретизацию с многоклассовой классификацией. У меня 18 различных классов.
Я пробовал использовать следующий код:
# generate dataset
X, y = make_classification(n_samples=10000, n_features=18, n_redundant=0, n_clusters_per_class=1, weights=[0.99, 0.01], flip_y=0)
# summarize class distribution
print(Counter(y))
# define sampling strategy
sample = SMOTEENN(sampling_strategy=0.5)
# fit and apply the transform
X_rs, y_rs = sample.fit_resample(X_train, y_train)
# summarize class distribution
print(Counter(y_rs))
Но я получил следующую ошибку:
ValueError: "sampling_strategy" can be a float only when the type of target is binary. For multi-class, use a dict.
Любая помощь? Заранее спасибо