Получить сгенерированный источник HTML-страницы программно - PullRequest
0 голосов
/ 07 июня 2018

Какой самый простой способ получить сгенерированную веб-страницу сайта программно на любом языке программирования?

Необходимая сгенерированная веб-страница - это та, которую вы получаете, если переходите на веб-страницу в Firefox.и нажмите Ctrl-a, затем щелкните правой кнопкой мыши и нажмите «View Source Source».

Единственный способ, который приходит на ум - понять код веб-браузера chromium open source и получить отрендеренныйстраницы и использовать его в нашем сервисе.

Но я считаю, что может быть другое решение, о котором я не знаю.

Ответы [ 2 ]

0 голосов
/ 07 июня 2018

Если вы хотите сделать это на стороне сервера, вы можете использовать file_get_contents ()

Пример:

 file_get_contents(path_to_webpage);

Для справки:

http://php.net/manual/en/function.file-get-contents.php

https://www.w3schools.com/php/func_filesystem_file_get_contents.asp

0 голосов
/ 07 июня 2018

В javascript вы можете получить полное содержимое документа с помощью

var html = document.documentElement.innerHTML;
...