Как применить бинарную маску к текстовым изображениям для разделения текстовых областей в Python? - PullRequest
0 голосов
/ 16 июня 2019

У меня есть несколько текстовых изображений сцены, к которым я должен применить двоичную маску, чтобы получить выходное изображение в виде текстовых пикселей, равных 1 , и нетекстовых пикселей, равных 0 , в качестве предварительной обработкиэтап обнаружения текста сцены.

Как добиться того же?

Я могу предоставить образцы изображений, если требуется.

Образцы изображений представлены здесь:

enter image description here

enter image description here

enter image description here

1 Ответ

1 голос
/ 16 июня 2019

Это должно сработать:

from PIL import Image

image_original = Image.open('kSZzc.png')
image_gray = image_original.convert("L") # Convert to grayscale image
image_gray_bw = image_gray.point(lambda pixel: 0 if pixel<128 else 255) # convert to binary image

Если текстовая часть изображения имеет относительно более яркие цвета, поменяйте местами 0 и 255 в коде, чтобы сделать текст черным, а не белым, как в случае с третьим изображением.

...