Как использовать Puppeteer для загрузки PDF - PullRequest
0 голосов
/ 18 мая 2018

Я пытаюсь немного поковыряться в Интернете, используя Puppeteer, но я не уверен, как на самом деле загрузить найденные документы.В частности, я хочу скачать PDF-файл со страницы типа this .Часть моего кода, которая пытается загрузить pdf, в настоящее время выглядит следующим образом (закомментированные строки - попытки загрузки, которые не сработали):

                const newPagePromise = new Promise(x => browser.once('targetcreated', target => x(target.page())));
                await page.click('#gvDocketResult_ctl0'+rows.length+'_hlDocumentRedacted');
                await page.waitFor(3000);
                const newPage = await newPagePromise;
                // need to figure out how to download
                await newPage._client.send('Page.setDownloadBehavior', {behavior: 'allow', downloadPath: '/Users/me/Desktop'});
                // await newPage.pdf({path: 'hn.pdf', format: 'letter'});
                // await newPage.click('#download');
                // await newPage.click('#icon');

Извините, если этот вопрос кажется очень простым, я только начал использовать PuppeteerНесколько дней назад, и я все еще немного потерян.Если кто-нибудь знает, как мне поступить, это будет очень признательно.

РЕДАКТИРОВАТЬ: Итак, из того, что я нашел до сих пор, кажется, что я могу получить ссылку, показанную в src = ''раздел веб-страницы (изображение ниже), тогда я мог бы использовать page.goto (ссылка), чтобы загрузить PDF?В любом случае я понятия не имею, как добраться до этой ссылки в кукловоде, поэтому, если у кого-то есть совет по этому вопросу, это также будет оценено.enter image description here

...