Я пытаюсь получить полное содержимое HTML-страницы одностраничного веб-приложения (AngularJS), используя puppeteer .Но я получил только HTML-содержимое верхнего и нижнего колонтитула.Этот код отлично работает на моей локальной машине, но не работает на сервере AMI .
//function for timeout
async function timeout(ms) {
return new Promise(resolve => setTimeout(resolve, ms));
}
// function to crawl a html page using a url
async function crawler(url) {
const browser = await puppeteer.launch({
headless: true,
args: ['--no-sandbox', '--disable-setuid-sandbox']
});
const page = await browser.newPage();
await page.goto(url); //fetch url
await timeout(5000); // wait for 5 second to load full page
const html = await page.evaluate(() => document.documentElement.outerHTML);
await browser.close();
return html;
}
Также пробовал waitFor
и networkidle2
, но в результате не получился правильный HTML.