Я хочу сделать скриншот своего рабочего стола, интерпретировать символы на рабочем столе, сгруппировать слова, а затем получить координаты этих слов, чтобы я мог щелкнуть по ним.
imageName = "images/desktop.png"
image = cv2.imread(imageName)
# Grab image data/characters
d = pytesseract.image_to_data(image)
print(d)
# Transform them into words? (not working yet, getting an error on len(d['level'])
n_boxes = len(d['level'])
for i in range(n_boxes):
(x, y, w, h) = (d['left'][i], d['top'][i], d['width'][i], d['height'][i])
cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)
print(x, y, w, h)
# Use these coordinates to click certain buttons etc.
pyautogui.click(coordinates)
Возможно? И можно ли будет сделать снимок экрана только с части моего экрана, но при этом получить правильные координаты?)
Изображение моего рабочего стола создается следующим образом:
def fullScreenShot():
# Take a full screen shot.
with mss.mss() as sct:
screenShot = sct.shot(output="images/desktop.png")