Question

Я пытаюсь сделать работу OCR.pytesseract не очень хорошо работает с изображениями Wand, но Python Image Library не может выполнить некоторые преобразования изображений, которые я хочу сделать, чтобы улучшить распознавание текста.

В настоящее время я используюЧтобы открыть изображение, сделайте мои преобразования ImageMagick, затем сохраните его во временном файле, который я затем открою с помощью Pillow и передам в pytesseract.Есть ли способ, которым я могу сделать это без использования временного файла?Я хотел бы иметь возможность обрабатывать все это с помощью функций, которые не могут потенциально запутать друг друга, если они работают параллельно.

futuraprime · Answer 1 · 21 ноября 2018

Чтобы перейти от Wand к PIL, вы можете использовать io.BytesIO:

with io.BytesIO() as transfer:
    with WandImage(filename=fpath) as img:
        img.unsharp_mask(radius=2, sigma=0, amount=75, threshold=2)
        img.level(black=150/255, white=202/255, gamma=2.1)
        img.save(transfer)

    with Image.open(transfer) as img:
        text = pytesseract.image_to_string(img)
        with open('./%s/%s-tess4.txt' % (outputdir, fname), 'w+') as f:
            f.write(text)

Однако это не работает для перемещения изображения PIL в Wand.

Как передать изображение от палочки к подушке?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как передать изображение от палочки к подушке?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы