URL в PDF решение - PullRequest
       24

URL в PDF решение

0 голосов
/ 28 октября 2019

Как я могу передать этот URL в PDF? Я пытаюсь с помощью приведенного ниже кода, но не работает Я пытался с URL в PNG или скриншот страницы, но не работает, просто сгенерировать пустой pdf / image

Любое решение?

URL: http://windte1910.acepta.com/v01/0EF57BFD40060E245941AE43E3F7DAB700A06338

Код:

import pdfkit

path_wkthmltopdf = r'C:\Program Files\wkhtmltopdf\bin\\wkhtmltopdf.exe'
config = pdfkit.configuration(wkhtmltopdf = path_wkthmltopdf)

pdfkit.from_url("http://windte1910.acepta.com/v01/0EF57BFD40060E245941AE43E3F7DAB700A06338", "out2.pdf", configuration=config)

Вывод:

Loading pages (1/6)
Warning: A finished ResourceObject received a loading progress signal. This might be an indication of an iframe taking too long to load.
Warning: A finished ResourceObject received a loading finished signal. This might be an indication of an iframe taking too long to load.
Counting pages (2/6)
Resolving links (4/6)                                                       
Loading headers and footers (5/6)                                           
Printing pages (6/6)
Done                                                                      
True

1 Ответ

0 голосов
/ 28 октября 2019

Проблема, которую я обнаружил, заключается в том, что в сети есть iframe, поэтому он выглядит пустым ... если вы измените этот URL для этого

http://windte1910.acepta.com/ca4webv3/index.jsp?url=http://windte1910.acepta.com/v01/0EF57BFD40060E245941AE43E3F7DAB700A06338

, тогда он будет работать. .. если у вас есть знания по html / css, проверьте консоль google chrome, и вы найдете ее. Может быть, вам стоит подумать о том, чтобы очистить содержимое iframe с помощью beautifulSoup

import pdfkit

path_wkthmltopdf = r'C:\Program Files\wkhtmltopdf\bin\\wkhtmltopdf.exe'
config = pdfkit.configuration(wkhtmltopdf = path_wkthmltopdf)

#pdfkit.from_url("http://windte1910.acepta.com/v01/0EF57BFD40060E245941AE43E3F7DAB700A06338", "out2.pdf", configuration=config)
pdfkit.from_url("http://windte1910.acepta.com/ca4webv3/index.jsp?url=http://windte1910.acepta.com/v01/0EF57BFD40060E245941AE43E3F7DAB700A06338", "out2.pdf", configuration=config)
...