Question

Я хочу извлечь текст на ярлыках из изображений. Изображения окрашены и находятся в реальной жизни. Изображения PFA. Образец изображения

Я пробовал несколько решений:

Я могу читать текст с плоских изображений с помощью Tesseract, но он не работает, если текст находится под определенным углом.
Попробовал много предварительной обработки изображения, преобразовав его в двоичный и в оттенки серого, но не смог извлечь необходимый текст.
Так как предыдущий шаг не удался, я также не смог де-перекосить текст.

    image = cv2.imread("p18-73.png",0)
    thresh = cv2.adaptiveThreshold(image,255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11,2)
    coords = np.column_stack(np.where(thresh > 0))
    angle = cv2.minAreaRect(coords)[-1]

Приведенный выше код предварительной обработки не работает. Подскажите, пожалуйста, как лучше всего подойти к этому изображению?

cel16 · Answer 1 · 28 мая 2019

Проверяли ли вы результат cv2.adaptiveThreshold ()? Результат cv2.adaptiveThreshold () выглядит следующим образом:

Я думаю, что это не то, что вы хотите. Попробуйте использовать глобальный порог cv2.threshold () и отрегулируйте пороговое значение.

ret, thresh = cv2.threshold(image, 240, 255, cv2.THRESH_BINARY)

Кроме того, вы можете добавить cv2.morphologyEx () для удаления шума.

kernel = np.ones((2,2),np.uint8)
thresh = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel)

Как извлечь текст из этих цветных изображений?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как извлечь текст из этих цветных изображений?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы