Используйте SMOTE для пересчета данных изображения - PullRequest
0 голосов
/ 07 декабря 2018

Я делаю двоичную классификацию с CNN, и данные несбалансированы, где положительное медицинское изображение: отрицательное медицинское изображение = 0,4: 0,6.Поэтому я хочу использовать SMOTE, чтобы пересмотреть положительные данные медицинского изображения перед тренировкой.Тем не менее, размер данных 4D (761,64,64,3), что вызывает ошибку

Found array with dim 4. Estimator expected <= 2

Итак, я изменяю мои train_data:

X_res, y_res = smote.fit_sample(X_train.reshape(X_train.shape[0], -1), y_train.ravel())

И это работаетхорошо.Перед тем, как передать его в CNN, я изменяю его обратно:

X_res = X_res.reshape(X_res.shape[0], 64, 64, 3)

Теперь я не уверен, является ли это правильным способом для избыточной выборки, и изменит ли оператор изменения формы структуру изображений?

...