Постоянное сохранение содержимого динамически меняющейся веб-страницы, которая открывается в моем браузере - PullRequest
0 голосов
/ 01 февраля 2019

Я хочу продолжать анализировать текст на динамически изменяющейся веб-странице. Контент зависит от моего имени входа в систему, и нет никаких API для запроса того же контента с помощью скрипта.

Так что единственный способ проанализироватьДля этого нужно открыть страницу в моем браузере, а затем сохранить веб-страницу в формате html (или в другом подходящем формате) и выполнить ее анализ.

Мне нужно проводить этот анализ каждые 2-3 секунды.Таким образом, я мог подумать, что для этого я автоматически сохраняю страницу с помощью скрипта и анализирую сохраненный контент.Может кто-нибудь предложить мне несколько способов сохранить открытую веб-страницу с помощью скрипта?

Или другие способы сделать анализ, который я хочу сделать.

1 Ответ

0 голосов
/ 01 февраля 2019

Вы можете использовать Puppeteer , API-интерфейс Chrome Node без головы.Таким образом, вы можете:

  1. Программно переходить на определенную страницу (или страницы)
  2. Дождаться, пока она отобразится (поскольку ваша страница динамическая)
  3. Сбросить еесодержимое (в HTML, PDF или другом формате) в файл
  4. Обработайте его так, как вы хотите
  5. (Необязательно) Включите цикл таймера (например, setInterval(() => { // Do stuff }, milliseconds))
...