Какие цифры в файле коробки Tesseract? - PullRequest
0 голосов
/ 20 ноября 2018

Я не могу из-за своей любви найти какую-либо документацию о том, как работают файлы коробок Tesseract и что представляют собой координаты.

Например, я получаю:

T 2768 165 2789 191 0

Первый токен - это, очевидно, персонаж. Я знаю, что Тессеракт использует внизу слева. Поэтому 2768 должно быть снизу. 4-й жетон (2789), похоже, самый верхний. Я не понимаю, что такое 3-й (165), 5-й (191) и 6-й (0) токены. 165 и 191 неверны как левая / правая координаты, а 0 Я понятия не имею, к чему это относится.

Кто-нибудь может мне помочь? Это пиксельные координаты, или я должен учитывать DPI изображения?

Спасибо!

1 Ответ

0 голосов
/ 20 ноября 2018

В соответствии с документацией формат для каждой строки:

<symbol> <left> <bottom> <right> <top> <page>

Где:

  • <symbol> - это символ, например, a или b.
  • <left> <bottom> <right> <top> - это координаты прямоугольника, который соответствует символу на странице.Обратите внимание, что система координат, используемая Tesseract, имеет (0,0) в левом нижнем углу изображения!
  • <page> имеет значение только в том случае, если вы используете многостраничные файлы TIFF.Во всех других случаях просто введите здесь 0.

Так что в вашем конкретном случае

T 2768 165 2789 191 0

будет

  • символ: T
  • слева: 2768
  • внизу: 165
  • справа: 2789
  • вверху: 191
  • страница: 0
...