Получаемый вами XML синтезируется в соответствии с этой схемой .
Для каждого распознанного символа он будет содержать экземпляр элемента charParams
, как показано в ответе, который вы связали с . Элемент будет содержать координаты в пикселях страницы - тот же XML также содержит элемент page
:
<page width="..." height="..." resolution="..." originalCoords="...">
где хранятся ширина и высота изображения. Таким образом, l
и r
для каждого элемента charParams
находятся в диапазоне 0..width-1
соответствующей страницы, а t
и b
для каждого элемента charParams
находятся в диапазоне 0..height-1
соответствующей страницы.
Также стоит прямо упомянуть, что все координаты в пикселях - они полностью независимы от разрешения. Вот почему всякий раз, когда вы пытаетесь выделить что-либо на изображении, вы должны принимать во внимание увеличение - изображение, скорее всего, не всегда будет отображаться как есть в программном обеспечении вашего устройства, но будет уменьшено, и вам придется отображать координаты страницы на увеличенном координаты изображения и выделите соответствующим образом.