Извлечь указанный c диапазон строк из PDF в TXT с Python fitz - PullRequest
0 голосов
/ 28 мая 2020

Я хочу извлечь конкретный c диапазон строк из файла PDF. Я могу извлечь весь контент, но мне нужно извлечь только строки 8-11 . Вот извлечение всего содержимого:

import fitz
ifile = "C:\\\Users\***\Desktop\Example.pdf"
doc = fitz.open(ifile)
page_count = doc.pageCount
page = 0
text = ''
while (page < page_count):
    p = doc.loadPage(page)
    page += 1
    text = text + p.getText()
text_file = open("sample.txt", "w")
n = text_file.write(text)
text_file.close()
...