Question

Я работаю над извлечением текста с использованием обработки изображений и pytesseract.Я получил ненужные символы на выходе.Я хочу удалить это.Пожалуйста, предложите любую технику, чтобы сделать это.

A = Image.open("C:\\Users\\salaspure\\Desktop\\Shyam\\1.tif")
B = A.crop((437,26,975,138))
pytesseract.image_to_string(B)

Получил вывод как: "EE AEE NENA EON Amm Cvahg WALLEY БОЛЬНИЦА БОЛЬНИЦЫ 620 ТЕНЬ ЛОЖА ИЛАС ВЕГАС NV 891064119"

Требуемый вывод: "БОЛЬНИЦАВ стационаре 620 ТЕНЕВНАЯ ЛАЙКА ИЛАС ВЕГАС NV 891064119 "

Как удалить ненужные слова (не английские слова) с помощью регулярных выражений?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как удалить ненужные слова (не английские слова) с помощью регулярных выражений?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы