Это базовая практика того, как начать работу с Tesseract для создания OCR Engine для считывания показаний счетчиков электроэнергии и воды
train_1=['F:\Misc\Meter Pics\mfaphotos\\'+ name for name in os.listdir('F:\Misc\Meter Pics\mfaphotos') if os.path.isfile(os.path.join('F:\Misc\Meter Pics\mfaphotos', name))]
train_2=['F:\Misc\Meter Pics\mfa photos2\\' + name for name in os.listdir('F:\Misc\Meter Pics\mfa photos2') if os.path.isfile(os.path.join('F:\Misc\Meter Pics\mfa photos2', name))]
train=train_1 +train_2
for i in range(0,len(train)-1):
if train[i].split('.')[1]!='jpg':
continue
img = cv2.resize(np.asarray(Image.open(train[i])) ,(300,300))
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# Apply dilation and erosion to remove some noise
kernel = np.ones((1, 1), np.uint8)
img = cv2.dilate(img, kernel, iterations=1)
img = cv2.erode(img, kernel, iterations=1)
# Apply blur to smooth out the edges
img = cv2.GaussianBlur(img, (5, 5), 0)
# Apply threshold to get image with only b&w (binarization)
img = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]
print(img)
# Save the filtered image in the output directory
type(Image.fromarray(img))
save_path = os.path.join('F:\Misc\Final_modified', train[i] + "_filter_" + ".jpg")
cv2.imwrite(save_path, img)
ОШИБКА В КОДЕ - Код, в котором мы получаем ошибку
for i in range(0,len(train)-1):
save_path = os.path.join('F:\Misc\Final_modified', train[i] + "_filter_" +
".jpg")
#Image.load(save_load)
result = pytesseract.image_to_string(Image.open(save_path), lang="eng")
results[save_path] = result
СООБЩЕНИЕ ОБ ОШИБКЕ
TesseractError: (2, 'Usage: python pytesseract.py [-l lang] input_file')
Вопрос- Что означает сообщение об ошибке?