Мне нужно объединить папку, полную PDF-файлов, в один файл.Однако они должны быть объединены в определенном порядке.Пример имен файлов:
WR_Mapbook__1.pdf
WR_Mapbook__1a.pdf
WR_Mapbook__2.pdf
WR_Mapbook__2a.pdf
WR_Mapbook__3.pdf
WR_Mapbook__3a.pdf
etc...
Способ, которым они сортируются в проводнике Windows, - это способ, которым мне нужно, чтобы они были добавлены в один файл.Однако мой сценарий добавляет сначала все файлы «a», а затем файлы без «a».Почему это так?Как мне отсортировать файлы так, как я хочу?
См. Код ниже.Спасибо!
from pyPdf import PdfFileWriter, PdfFileReader
import glob
outputLoc = "K:\\test\\pdf_output\\"
output = PdfFileWriter()
pdfList = glob.glob(r"K:\test\lidar_MB_ALL\*.pdf")
pdfList.sort
print pdfList
for pdf in pdfList:
print pdf
input1 = PdfFileReader(file(pdf, "rb"))
output.addPage(input1.getPage(0))
# finally, write "output" to document-output.pdf
outputStream = file(outputLoc + "WR_Imagery_LiDar_Mapbook.pdf", "wb")
output.write(outputStream)
print ("adding " + pdf)
outputStream.close()