Question

Я пытаюсь предварительно обработать PDF-файл в TIF-изображение для распознавания текста.В командной строке я могу сделать это, преобразовав PDF в TIF, используя следующую команду ImageMagick:

$ convert -density 300 /path/to/my/document.pdf -depth 8 -strip -background white -alpha off file.tiff

Как я могу получить эквивалентный результат в Java?В настоящее время я могу конвертировать PDF в TIF с помощью tess4j, но как я могу изменить масштаб и предварительно обработать полученный TIF?Какие библиотеки позволят мне сделать это быстро и легко?

nao · Answer 1 · 24 января 2019

Разобрался.Вместо того, чтобы пытаться изучить другую библиотеку предварительной обработки изображений, я просто использовал im4java , чтобы деформировать командную строку IM, а затем непосредственно преобразовал команду в следующее:

    ConvertCmd cmd = new ConvertCmd();

    IMOperation op = new IMOperation();
    op.addImage(imagePath);
    op.density(300);
    op.depth(8);
    op.strip();
    op.background("white");
    op.alpha("off");

    try {
        cmd.run(op);
    } catch (IOException e) {
        e.printStackTrace();
    } catch (InterruptedException e) {
        e.printStackTrace();
    } catch (IM4JavaException e) {
        e.printStackTrace();
    }

Обработка файла TIF - преобразование этого преобразования из ImageMagick в Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Обработка файла TIF - преобразование этого преобразования из ImageMagick в Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы