Я создаю программное обеспечение для преобразования изображений счетов-фактур в редактируемый формат (преобразование как текстовых, так и табличных данных).До сих пор я нашел контуры в python для преобразования изображения в более мелкие фрагменты, которые помогают в поиске местоположения текста, а Tesseract используется для преобразования этих изображений в текст.
Я извлек текст, но теперь проблема состоит в том, чтобы поместить этот текст в известные позиции в простом блокноте или текстовом документе или любом другом, который вы предлагаете.
Пример счетов-фактур: