Индексы возврата не работают для функции imblearn NearMiss - PullRequest
0 голосов
/ 19 сентября 2019

Приведенный ниже код выполняется при выборке для моего несбалансированного набора данных.

X, y = make_imbalance(inputs, output,sampling_strategy={0: 25, 1: 35, 2: 22,3:7,4:6})
X_train, X_test, y_train, y_test = train_test_split(X, y)

print('Training target statistics: {}'.format(Counter(y_train)))
print('Testing target statistics: {}'.format(Counter(y_test)))

pipeline=make_pipeline(NearMiss(ratio='all',version=3,return_indices=True),KNeighborsClassifier(n_neighbors=5))
pipeline.fit(X_train, y_train)
print(classification_report_imbalanced(y_test, pipeline.predict(X_test)))

Но когда я передаю return_indices = True, я получаю следующие выходные данные и ошибку:

Обучениестатистика цели: счетчик ({1: 24, 0: 20, 2: 15, 3: 6, 4: 6})

Тестирование статистики цели: счетчик ({1: 11, 2: 7, 0:5, 3: 1})

ValueError: слишком много значений для распаковки (ожидается 2)

...