Я бы хотел создать переменную для желаемого текста, который вы хотите извлечь. После того, как вы запустите OCR для изображения, сохраните его вывод в списке. Например:
disired_text = 'Health OK'
OCR_output = ['Multivitamin', 'Multiminerals', 'Amino Acids', 'with Taurine', 'Health OK']
Получив эти списки, вы можете использовать любой алгоритм сопоставления строк, например нечеткое сопоставление, для извлечения наилучшего совпадения из списка OCT_output Например:
score_dict = {} #initializing dictionary to store text and score
for output_text in OCR_output:
score = fuzzy_match_function(output_text, desired_text)
score_dict[output_text] = score
Вы получите Score_dict (словарь), содержащий текст и оценки. Вы можете извлечь тот, который имеет минимальное расстояние с желаемой переменной.
Надеюсь, это сработает для вас!