Конвертировать многостраничный файл Тессеракта в OpenCV X, Y, ширина, высота - PullRequest
0 голосов
/ 08 ноября 2018

Так что мне нужно преобразовать файл многостраничного блока, сгенерированный Tesseract, в координаты матрицы OpenCV, чтобы обрезать ROI изображения. Проблема заключалась в том, что значения координат, записанные в файле блока, отличаются от системы координат изображения в OpenCV.

Файлы коробок выглядят так:

    Page 0
H 357 1494 422 1562 0
9 453 1495 515 1560 0
3 556 1494 605 1560 0
V 634 1494 694 1561 0
F 726 1495 786 1562 0
1 828 1495 854 1562 0
L 908 1495 971 1562 0

    Page 1
H 371 1369 434 1425 1
9 461 1372 519 1425 1
3 556 1373 606 1427 1
V 634 1376 694 1430 1
F 718 1378 780 1432 1
1 820 1378 846 1435 1
L 893 1379 954 1437 1 

Если я открою координату через jTessBoxEditor, числовые значения преобразуются в систему координат изображения:

jTessBoxEditor координаты на странице изображения 0

Координаты jTessBoxEditor на странице изображения 1

image ROI, который я пытался достичь

Я понимаю, что значения координат в файле блока Тессеракта представляют собой нижнюю левую систему координат, в то время как значения координат OpenCV-изображения равны верхняя левая . Я попытался преобразовать эти значения координат путем вычисления разницы между значениями в файле блока и jTessBoxEditor, проблема заключалась в том, что разница между этими значениями различна для каждой страницы.

Итак, как лучше всего преобразовать значения координат в многостраничном файле блока в систему координат изображения в OpenCV для каждой страницы , не пытаясь вычислить ее по одному?

...