Неточное предсказание в пользовательской модели MLKit - PullRequest
0 голосов
/ 27 февраля 2019

Попытка использовать переобученную модель MobileNet для прогнозирования пород собак, но при использовании модели через Firebase MLKit она не может правильно предсказать породу собак.Модель настольного компьютера и модель tflite способны правильно предсказать породу, но, используя одно и то же изображение мопса , модель рабочего стола и модель tflite (на рабочем столе) уверены на 87,8%что это мопс;в то время как на MLKit уверенность составляет 1,47x10-2%.

Я подозреваю, что проблема заключается в моей предварительной обработке изображения в коде приложения. Документы показывают, как масштабировать пиксели в диапазоне -1,0, 1,0;что в соответствии с кодом для функции предварительной обработки изображения keras является тем, что требуется.

Вот моя infer(iStream) функция, в которой, я думаю, может лежать ошибка.Любая помощь очень ценится, это сводит меня с ума.

private fun infer(iStream: InputStream?) {
    Log.d("ML_TAG", "infer")
    val bmp = Bitmap.createScaledBitmap(BitmapFactory.decodeStream(iStream), 224, 224, true)
    i.setImageBitmap(bmp)
    val bNum = 0
    val input = Array(1) { Array(224) { Array(224) { FloatArray(3) } } }
    for (x in 0..223) {
        for (y in 0..223) {
            val px = bmp.getPixel(x, y)
            input[bNum][x][y][0] = (Color.red(px) - 127) / 255.0f
            input[bNum][x][y][1] = (Color.green(px) - 127) / 255.0f
            input[bNum][x][y][2] = (Color.blue(px) - 127) / 255.0f
        }
    }

    val inputs = FirebaseModelInputs.Builder()
        .add(input)
        .build()

    interpreter.run(inputs, ioOpts).addOnSuccessListener { res ->
        val o = res.getOutput<kotlin.Array<FloatArray>>(0)
        val prob = o[0]

        val r = BufferedReader(InputStreamReader(assets.open("retrained_labels.txt")))
        val arrToSort = arrayListOf<Pair<String, Float>>()
        val rArr = r.readLines()
        for (i in prob.indices) {
            val p = Pair(rArr[i], prob[i])
            arrToSort.add(p)
        }
        val sortedList = arrToSort.sortedWith(compareByDescending {it.second})
        val topFive = sortedList.slice(0..4)
        arrToSort.forEach {
            if (it.first == "pug") {
                Log.i("ML_TAG", "Pug: ${it.second}")
            }
        }
        sortedList.forEach {
            if(it.first == "pug") {
                Log.i("ML_TAG", "Pug: ${it.second}")
            }
        }
        topFive.forEach {
            Log.i("ML_TAG", "${it.first}: ${it.second}")
        }
    }
        .addOnFailureListener { res ->
            Log.e("ML_TAG", res.message)
        }
}

1 Ответ

0 голосов
/ 21 марта 2019

Я думаю, (Color.red(px) - 127) / 255.0f масштабируется до [-0,5, 0,5].(Color.red(px) - 127) / 128.0f дает лучшие результаты?

...