Несколько лет назад я применил ограничивающий прямоугольник и выделил слова в своем приложении.Вы сказали: «У меня есть этот текст в простом цифровом формате».Одним из ключевых компонентов является наличие координат символов или слов, чтобы отобразить их в соответствующих областях изображения.Как и в PDF с возможностью поиска, при выделении текста он внутренне сопоставляется со слоем изображения, а противоположный выбор на изображении выбирает соответствующий текст.Но даже из PDF эти координаты не могут быть экспортированы, я считаю.Если в вашем тексте в настоящее время нет такой информации о координатах, возможно, проще всего будет повторно отобразить изображения с помощью высококачественного механизма, который может выводить координаты как часть вывода.Если вы будете использовать WiseTREND OCR Cloud 2.0, то вывод XML будет производить все эти подробные метаданные.Если информация о координатах существует, то все основные компоненты присутствуют, и это всего лишь обход эффективного дизайна пользовательского интерфейса.