Pypdf3 и специальные символы - PullRequest
0 голосов
/ 17 июня 2019

У меня проблема с pyPDF3.Он не распознает этот символ :: ✓, этот заменяется пробелом.

Вот мой код:

def pdf_splitter(path):
    list_page_texts=[]
    list_page_formats=[]
    fname = os.path.splitext(os.path.basename(path))[0]
    pdf = PdfFileReader(path)
    for page_nb in range(pdf.getNumPages()):
        page = pdf.getPage(page_nb)
        text = page.extractText()
        list_page_texts.append(text)
        list_page_formats.append('Page type: {}'.format(str(type(page))))

    return list_page_texts,list_page_formats

Как получить этот конкретный символ без замены пробелами?

...