Я работаю над извлечением текста с использованием обработки изображений и pytesseract.Я получил ненужные символы на выходе.Я хочу удалить это.Пожалуйста, предложите любую технику, чтобы сделать это.
A = Image.open("C:\\Users\\salaspure\\Desktop\\Shyam\\1.tif")
B = A.crop((437,26,975,138))
pytesseract.image_to_string(B)
Получил вывод как: "EE AEE NENA EON Amm Cvahg WALLEY БОЛЬНИЦА БОЛЬНИЦЫ 620 ТЕНЬ ЛОЖА ИЛАС ВЕГАС NV 891064119"
Требуемый вывод: "БОЛЬНИЦАВ стационаре 620 ТЕНЕВНАЯ ЛАЙКА ИЛАС ВЕГАС NV 891064119 "