конфигурация pytesseract для обнаружения таблицы - PullRequest
0 голосов
/ 21 октября 2019

У меня есть задание конвертировать отсканированные счета в редактируемый формат, я использую tesseract и он отлично справляется со своей задачей, но у меня возникли проблемы с таблицами, мне нужно сохранить макет отсканированного изображения.

Я пробовал обнаружение таблиц, но это бесполезно, так как я полностью зависел от tesseract.

import numpy as np 
import matplotlib.pyplot as plt
import os
from PIL import Image
import pytesseract



r = Image.open('8.png')
r.load()
text = pytesseract.image_to_string(r,config='config='-c textord_show_tables 1 preserve_interword_spaces=1x1 --psm 1 --oem 3',lang="eng" )
print(text)
with open("response.txt",'w') as f: f.write(str(text))

Мне нужно написать текст и нарисовать таблицу с ее содержимым в слове или любом текстовом файле.

...