Question

Я хочу получить следующий ожидаемый результат. Можете ли вы дать мне какие-либо предложения по улучшению результата?

Входное изображение

Ожидается результат

流 動 資 産
固 定 資 産

Фактический результат

産 産
資 資
動 定

Воспроизвести результат

$ git clone https://github.com/zono/ocr.git
$ cd ocr
$ git checkout 0f2541eac302dd1fe2efbbd3b36e7ba40a99d232
$ docker-compose up -d
$ docker exec -it ocr /bin/bash
# /usr/local/bin/tesseract /ocr/src/bssample7.png stdout -l jpn
産 産
資 資
動 定

версии

$ docker -v
Docker version 19.03.5, build 633a0ea

# tesseract -v
tesseract 4.1.1-rc2-22-g08899
 leptonica-1.79.0
  libjpeg 8d (libjpeg-turbo 1.5.2) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11

Ebby · Answer 1 · 30 января 2020

вам нужно использовать другой метод сегментации страницы, чтобы получить ожидаемый результат.

Попробуйте добавить - psm 6 к вашей команде, чтобы она выглядела следующим образом:

$ tesseract /ocr/src/bssample7.png outputfilename -l jpn --psm 6

Здесь вы можете прочитать о различных методах:

https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality#page -segmentation-method

С уважением

zono · Answer 2 · 30 января 2020

Я нашел решение от Тессеракт OCR, читаемый по горизонтали, а не по вертикали C#

# /usr/local/bin/tesseract /ocr/src/bssample7.png stdout -l jpn --psm 6
流 動 資 産
固 定 資 産

Как улучшить точность чтения тессеракта?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как улучшить точность чтения тессеракта?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы