У меня есть задание конвертировать отсканированные счета в редактируемый формат, я использую tesseract и он отлично справляется со своей задачей, но у меня возникли проблемы с таблицами, мне нужно сохранить макет отсканированного изображения.
Я пробовал обнаружение таблиц, но это бесполезно, так как я полностью зависел от tesseract.
import numpy as np
import matplotlib.pyplot as plt
import os
from PIL import Image
import pytesseract
r = Image.open('8.png')
r.load()
text = pytesseract.image_to_string(r,config='config='-c textord_show_tables 1 preserve_interword_spaces=1x1 --psm 1 --oem 3',lang="eng" )
print(text)
with open("response.txt",'w') as f: f.write(str(text))
Мне нужно написать текст и нарисовать таблицу с ее содержимым в слове или любом текстовом файле.