python скрипт и Google Vision API для чтения c текст PDF - PullRequest
0 голосов
/ 13 июля 2020

Я внедряю библиотеку API Google Vision в python и читаю файл PDF, документ счета и извлекаю из него данные. Я мог бы извлечь аннотации и полный текст, но теперь я хочу написать общую c функцию в python для выбора и поиска определенного c текста, такого как код счета, номер заказа и c. в переменной. Я попытался прочитать как изображение и обработать в фрагменте кода ниже, найдя слово и координаты, но это не работает. Фрагмент кода, как показано ниже.

pages = convert_from_path('pdf_file', 1)
image = types.Image(content=pages.pop(0))

response = client.document_text_detection(image=image)
document = response.full_text_annotation
def assemble_word(word): 
    assembled_word="" 
    for symbol in word.symbols: 
            assembled_word+=symbol.text 
            return assembled_word 
     
def find_word_location(document,word_to_find): 
    for page in document.pages: 
        for block in page.blocks: 
             for paragraph in block.paragraphs: 
                for word in paragraph.words: 
                    assembled_word=assemble_word(word) 
                    if(assembled_word==word_to_find): 
                        return word.bounding_box
location = find_word_location(document,'PO number') 
print(location)
...