Сохранить набор данных Spark 2.3.0 в качестве формата изображения - PullRequest
0 голосов
/ 28 апреля 2018

Используя новую функцию Spark 2.3.0, ImageSchema, я считал некоторые изображения в виде набора данных, и теперь после внесения в них изменений я хочу сохранить их как форматы изображений (png, jpeg). Я получил данные каждой строки набора данных (byte []) и попытался сохранить их как png файл, но экспортированный файл недействителен!

Dataset<Row> images = ImageSchema.readImages("images/");
images.foreach(data_row -> {
    Row row = data_row.getAs(0);
    File file = new File(Paths.get(ImageSchema.getOrigin(row)).getFileName().toString() + ".png");
    FileOutputStream fos = new FileOutputStream(file);

    fos.write(ImageSchema.getData(row));
    fos.flush();
    fos.close();
}

1 Ответ

0 голосов
/ 04 июня 2019

Похоже, что imageData имеет определенный формат, который требует манипуляций перед записью непосредственно в файл.

https://github.com/databricks/spark-deep-learning/blob/master/src/main/scala/com/databricks/sparkdl/ImageUtils.scala

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...