Я хочу выделить определенные слова / предложения на скриншоте сайта.
После создания снимка экрана я извлекаю текст, используя pytesseract
и cv2
. Это хорошо работает, и я могу получить текст и данные об этом.
import pytesseract
import cv2
if __name__ == "__main__":
img = cv2.imread('test.png')
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
result = pytesseract.image_to_data(img, lang='eng', nice=0, output_type=pytesseract.Output.DICT)
print(result)
Используя объект результатов, я могу найти нужные слова и предложения.
Вопрос в том, как вернуться к изображению и выделить это слово?
Стоит ли искать другие библиотеки или есть способ получить значения в пикселях, а затем выделить текст?
В идеале я хотел бы получить начальную и конечную координаты каждого слова, как это можно сделать?