ImportError: невозможно импортировать имя 'image_to_data' с помощью pytesseract - PullRequest
0 голосов
/ 01 апреля 2019

Я использую OCR для извлечения текста и его координат (ограничивающих рамок) из image.image_to_string работает нормально, но image_to_data выводит ошибку и требуется для извлечения ограничивающей рамки из текстов. Есть идеи, почему это может происходить? Я использую Windows 10 для этого.

import pytesseract
import cv2
pytesseract.pytesseract.tesseract_cmd = 'C:/Users/Anwer/AppData/Local/Tesseract-OCR/tesseract.exe'
from PIL import Image
from pytesseract import image_to_data
img = cv2.imread('C:/Users/Anwer/Desktop/Density Plot.png', 1) 
cv2.imwrite("Graph.jpeg",img)
img=Image.open('Graph.jpeg')
d=image_to_data(img,output_type=Output.DICT)
n_boxes = len(d['level'])
for i in range(n_boxes):
    (x, y, w, h) = (d['left'][i], d['top'][i], d['width'][i], d['height'][i])
    cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)
cv2.imshow('img', img)
cv2.waitKey(0)

Я ожидаю, что результат выдаст мне координаты ограничивающих рамок, но функция image_to_data не импортируется. Фактически не импортируется ни одна функция, кроме image_to_string.

1 Ответ

0 голосов
/ 02 апреля 2019

Хорошо, я решил проблему самостоятельно. У меня была версия тессеракта 4.0. Я удалил его, а затем установил более старую версию tesseract от 3.05.02. После этого все, казалось, работало нормально. Кроме того, после этого, пожалуйста, удалите и установите также pytesseract.

...