OCR в реальном времени в Python - PullRequest
       57

OCR в реальном времени в Python

0 голосов
/ 19 октября 2018

Проблема

Я пытаюсь захватить мой рабочий стол с помощью OpenCV и заставить Tesseract OCR найти текст и установить его в качестве переменной, например, если я собираюсь играть в игру ииметь кадр захвата на сумму ресурса, я хочу, чтобы это распечатать и использовать его.Прекрасным примером этого является видео от Micheal Reeves , где всякий раз, когда он теряет здоровье в игре, он показывает его и отправляет на страйкбольное оружие с поддержкой Bluetooth, чтобы выстрелить в него.Пока у меня есть это:

# imports
from PIL import ImageGrab
from PIL import Image
import numpy as np
import pytesseract
import argparse
import cv2
import os

fourcc = cv2.VideoWriter_fourcc(*'XVID')
out = cv2.VideoWriter("output.avi", fourcc, 5.0, (1366, 768))

while(True):
        x = 760
        y = 968

        ox = 50
        oy = 22

        # screen capture
        img = ImageGrab.grab(bbox=(x, y, x + ox, y + oy))
        img_np = np.array(img)
        frame = cv2.cvtColor(img_np, cv2.COLOR_BGR2RGB)
        cv2.imshow("Screen", frame)
        out.write(frame)

        if cv2.waitKey(1) == 0:
                break

out.release()
cv2.destroyAllWindows()

он захватывает в реальном времени и отображает его в окне, но я понятия не имею, как заставить его распознавать текст в каждом кадре и выводить его.

любая помощь?

...