Одна вещь, которую вы знаете, это то, что это номер кредитной карты - это поможет проверить результат в конце. Вы можете использовать это для тонкой настройки обработки изображения - отправьте отзыв о результате и используйте методы оптимизации (такие как восхождение на гору или генетические алгоритмы), чтобы изменить параметры обработки изображения.
Например, выполните обработку изображения с набором параметров (p1, p2, p3, p4) - затем попробуйте OCR, и вы получите 6 цифр. Затем измените набор параметров - скажем, на этот раз вы получите 8 числовых цифр - используйте восхождение на холм, чтобы продолжать изменять набор.
Для обработки изображений
- Вероятно, вы хотите начать с обрезки числовых областей, если вы их знаете.
- Очистите пиксели, которые не находятся в рельефном цветовом диапазоне, чтобы извлечь как можно больше информации (допустимое отклонение этого является одним из параметров в наборе параметров, который я описал) - возможно, сделайте это, установив его в черный цвет, потому что часть цифр, которую легко увидеть, светлая
- Задайте светлый цвет тиснения - попробуйте извлечь его, а затем инвертировать, потому что OCR находит черный на белом
- Подключение закрытых секций
- OCR и подача результатов в выбор параметров на шаге 2, 3, 4 (и, возможно, 1, если вы выполняете автоматическую сегментацию)