Очистка (или предотвращение) лишних пробелов с PyPDF2 - PullRequest
0 голосов
/ 09 июня 2018

Я извлекал текст из PDF-файлов, используя PyPDF2.Однако, кажется, вводится ошибочный пробел между словами.Кто-нибудь знает способ избежать этого, или почистить его после свершившегося факта?Вот пример:

'В ВОПРОСЕ заявления, поданного 1113 York Avenue Realty Company, LLC и 60th Street Develment LLC в соответствии с разделами 197-c и 201 Нью-Йоркской хартиидля изменения карты зонирования, разделы 8c и 8d: '

Здесь "развитие" пишется как "развитие", а "" - это пишется как "е".Я хотел бы исправить это.

Вот PDF .Текст примера взят из первой позиции списка на первой странице.

...