На этом изображении tesseract определяет текст как LOOOPCS
, но это 1000PCS
. Используемая мной команда:
tesseract "item_04.png" stdout --psm 6
Я перепробовал все значения psm от 0 до 13
Согласно предложениям других блогов также задаются вопросы о SO и inte rnet после обрезки изображения и порогового значения.
Также пробовал -c tessedit_char_whitelist=PCS0123456789
, но это дает 00PCS . Но я не получаю 1000 шт. Может кто-нибудь попробовать это и сообщить мне, что мне не хватает?
Редактировать:
Согласно предложению @nathancy, попытался использовать - cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU
, который работал с этими 1 и 0, но не получился для изображения ниже , Он определяется как LL8gPcs: