Я внедряю библиотеку API Google Vision в python и читаю файл PDF, документ счета и извлекаю из него данные. Я мог бы извлечь аннотации и полный текст, но теперь я хочу написать общую c функцию в python для выбора и поиска определенного c текста, такого как код счета, номер заказа и c. в переменной. Я попытался прочитать как изображение и обработать в фрагменте кода ниже, найдя слово и координаты, но это не работает. Фрагмент кода, как показано ниже.
pages = convert_from_path('pdf_file', 1)
image = types.Image(content=pages.pop(0))
response = client.document_text_detection(image=image)
document = response.full_text_annotation
def assemble_word(word):
assembled_word=""
for symbol in word.symbols:
assembled_word+=symbol.text
return assembled_word
def find_word_location(document,word_to_find):
for page in document.pages:
for block in page.blocks:
for paragraph in block.paragraphs:
for word in paragraph.words:
assembled_word=assemble_word(word)
if(assembled_word==word_to_find):
return word.bounding_box
location = find_word_location(document,'PO number')
print(location)