Question

Я использую Google Tessseract OCR (https://github.com/gali8/Tesseract-OCR-iOS) для преобразования изображений в текст в моем приложении iOS.

Я могу отсканировать и получить строку, используя следующий код.

let tesseract:G8Tesseract = G8Tesseract(language:"eng")
        tesseract.delegate = self
        tesseract.image = imageTaken // image taken from camera
        tesseract.engineMode = .tesseractCubeCombined  
        tesseract.recognize()  
        print(tesseract.recognizedText)

Сканирует и извлекает текст построчно. (Смешивает строки из других абзацев). Вот так.

Изображение 1

Теперь, как я могу получить текст в виде блока и прочитать строки из каждого блока в отдельности. Вот так.

Изображение 2

Вещи, которые я пробовал.

print (tesseract.recognizedBlocks (by: .block))
print (tesseract.recognizedBlocks (by: .paragraph))

Тем не менее он смешивает строки из разных абзацев и рассматривает тексты как одну строку, как показано на рисунке 1.

Любая помощь будет оценена. Заранее спасибо.

iOS - Как распознать текст как блок с помощью Tesseract OCR

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

iOS - Как распознать текст как блок с помощью Tesseract OCR

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы