Я написал программу OCR в Java, где она сканирует документы и находит в ней весь текст. Моя основная задача - найти номер счета, который может быть 6 или более целых.
Я использовал функцию подстроки, но это не так эффективно, поскольку позиция этого номера меняется с каждым документом, но он всегда присутствует в первых трех строках текста OCR.
Я хочу написать код в Java 8, откуда я могу перебрать первые три строки и получить эти 6 последовательных чисел.
Я использую Тессеракт для OCR.
Пример:
,——— ————i_
g DAILYW RK SHE 278464
E C 0 mp] on THE POUJER Hello, Mumbai, Co. Maha
из этого мне нужно извлечь число 278464 .
Пожалуйста, помогите !!