Извлечение текста / символов из изображений Xray с помощью Python - PullRequest
0 голосов
/ 08 сентября 2018

Enter image description here

Я пытаюсь извлечь символы на рентгеновском снимке, я пытался использовать pytesseract для извлечения, но не смог, я использовал хитрый край, чтобы удалить шум и извлечь, но тем не менее, я не могу извлечь текст / символы. Можете ли вы помочь / направить меня, чтобы извлечь текст / символы

Ответы [ 3 ]

0 голосов
/ 12 сентября 2018

Попробуйте этот туотриал, чтобы найти текст: https://www.pyimagesearch.com/2018/08/20/opencv-text-detection-east-text-detector/

Затем, найдя его, вы можете выделить и использовать tesseract для его распознавания.

0 голосов
/ 17 декабря 2018

pytesseract должно быть достаточно, если файл имеет форму «png» или «jpg». теперь предположим, что изображение это имя вашего изображения. Пожалуйста, напишите код ниже.

from PIL import Image

from pytesseract import image_to_string

import pytesseract 

pytesseract.pytesseract.tesseract_cmd = r'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

im = Image.open('F:/kush/invert.jpg')

pytesseract.image_to_string(im, lang = 'eng')
0 голосов
/ 08 сентября 2018

Если это DICOM-файл, вы можете использовать gdcm для получения атрибута. Он доступен и на питоне.

...