Question

У меня есть несколько текстовых изображений сцены, к которым я должен применить двоичную маску, чтобы получить выходное изображение в виде текстовых пикселей, равных 1 , и нетекстовых пикселей, равных 0 , в качестве предварительной обработкиэтап обнаружения текста сцены.

Как добиться того же?

Я могу предоставить образцы изображений, если требуется.

Образцы изображений представлены здесь:

GeoMSI · Answer 1 · 16 июня 2019

Это должно сработать:

from PIL import Image

image_original = Image.open('kSZzc.png')
image_gray = image_original.convert("L") # Convert to grayscale image
image_gray_bw = image_gray.point(lambda pixel: 0 if pixel<128 else 255) # convert to binary image

Если текстовая часть изображения имеет относительно более яркие цвета, поменяйте местами 0 и 255 в коде, чтобы сделать текст черным, а не белым, как в случае с третьим изображением.

Как применить бинарную маску к текстовым изображениям для разделения текстовых областей в Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как применить бинарную маску к текстовым изображениям для разделения текстовых областей в Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы