Тессеракт не распознает большие числа, если небольшое число близко - PullRequest
0 голосов
/ 15 февраля 2019

Мы используем Tesseract.js для распознавания цен некоторых продуктов.Некоторые теги имеют цену предложения для первоначальной цены.Самое ужасное, что мы получаем OCR большую цену только тогда, когда нет штриховой цены около .Но когда приближается штриховая цена, Tesseract не идентифицирует огромное не штрихованное число.

Мы уже используем этот параметр, но не знаем, как обращаться со всеми остальными сотнями возможных параметров.:

Tesseract.recognize(blob, {
    tessedit_char_whitelist: '1234567890,€'
});

Это те ценники, которые мы пытаемся распознать - индивидуально.Мы фокусируемся на одном ценнике одновременно с камерой смартфона.

enter image description here

...