Question

Я извлекал текст из PDF-файлов, используя PyPDF2.Однако, кажется, вводится ошибочный пробел между словами.Кто-нибудь знает способ избежать этого, или почистить его после свершившегося факта?Вот пример:

'В ВОПРОСЕ заявления, поданного 1113 York Avenue Realty Company, LLC и 60th Street Develment LLC в соответствии с разделами 197-c и 201 Нью-Йоркской хартиидля изменения карты зонирования, разделы 8c и 8d: '

Здесь "развитие" пишется как "развитие", а "" - это пишется как "е".Я хотел бы исправить это.

Вот PDF .Текст примера взят из первой позиции списка на первой странице.

Очистка (или предотвращение) лишних пробелов с PyPDF2

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Очистка (или предотвращение) лишних пробелов с PyPDF2

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы