Как вы можете запустить html-файл с его содержимым javascript на терминале Linux? - PullRequest
0 голосов
/ 11 февраля 2019

Я работаю над роботом для поиска сайтов, который извлекает из них конкретную информацию.И мне нужно запустить как минимум функцию «готов к документу» для файла html, чтобы контент был сгенерирован и я мог его получить.Как я могу это сделать?Я видел команду "Rhino", но, похоже, это только для файлов .js, файл является html-файлом.Как вы можете догадаться, он включает в себя как HTML, так и JS.План таков: загрузите html-файлы, отредактируйте их js-функции «готов к документу», получите вывод, передайте следующий, повторите.

1 Ответ

0 голосов
/ 11 февраля 2019

Вы можете попробовать какой-нибудь менеджер для браузера без головы.

Это пример того, как нечто подобное можно сделать с GoogleChrome / puppeteer .Если это не работает для вас, пожалуйста, опишите вашу задачу и проблемы.

'use strict';

const puppeteer = require('puppeteer');

(async function main() {
  try {
    const browser = await puppeteer.launch();
    const [page] = await browser.pages();

    await page.goto('https://example.org/', { waitUntil: 'domcontentloaded ' });

    const data = await page.evaluate(() => {
      return document.title;
    });

    console.log(data);

    await browser.close();
  } catch (err) {
    console.error(err);
  }
})();
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...