Из-за вычислительных ограничений моего программного обеспечения ГИС я пытаюсь реализовать случайные леса в R для целей классификации изображений. Мой ввод - это многоканальное изображение TIFF, которое обучается в шейп-файле ArcGIS (целевые значения 0 и 1). Технически код работает и выдает корректный вывод. Когда я просматриваю матрицу путаницы, я получаю следующее:
0 1 class.error
0 11 3 0.214285714
1 1 13 0.071428571
Это разумно для моих данных. Однако, когда я строю выходные данные классификации изображений в моем программном обеспечении ГИС (двоичный файл, реклассифицированный tiff со значениями 0 и 1), он предсказывает тренировочные данные с вероятностью успеха 100%. Другими словами, нет ошибки классификации с выходным изображением. Как это так, когда матрица путаницы показывает, что есть ошибки классификации?
Я что-то упускаю здесь действительно очевидное? Фрагмент кода ниже.
rf.mdl <- randomForest(x=samples@data[, names(PredMaps)], y=samples@data[, ValueFld], ntree=501, proximity=TRUE, importance=TRUE, keep.forest=TRUE,keep.inbag=TRUE)
ConfMat = rf.mdl$confusion
write.csv(ConfMat,file = "ConfMat1.csv")
predict(PredMaps, rf.mdl, filename=classifiedPath, type="response", na.rm=T, overwrite=T, progress="text")
Я ожидал, что выходное классифицированное изображение неправильно классифицирует 1 из тренировочных баллов Value = 1 и неправильно классифицирует 3 тренировочных балла Value = 0 на основе того, что указано в матрице путаницы.