Как удалить ненужные слова (не английские слова) с помощью регулярных выражений? - PullRequest
0 голосов
/ 02 июля 2019

Я работаю над извлечением текста с использованием обработки изображений и pytesseract.Я получил ненужные символы на выходе.Я хочу удалить это.Пожалуйста, предложите любую технику, чтобы сделать это.

A = Image.open("C:\\Users\\salaspure\\Desktop\\Shyam\\1.tif")
B = A.crop((437,26,975,138))
pytesseract.image_to_string(B)

Получил вывод как: "EE AEE NENA EON Amm Cvahg WALLEY БОЛЬНИЦА БОЛЬНИЦЫ 620 ТЕНЬ ЛОЖА ИЛАС ВЕГАС NV 891064119"

Требуемый вывод: "БОЛЬНИЦАВ стационаре 620 ТЕНЕВНАЯ ЛАЙКА ИЛАС ВЕГАС NV 891064119 "

...