Как получить исходный код другой веб-страницы, используя HTML / JavaScript? - PullRequest
2 голосов
/ 17 октября 2019

Я пытаюсь написать HTML-код, который попадает на URL-адрес и извлекает мне его источник страницы, то есть весь контент, который мы видим, когда щелкаем правой кнопкой мыши на странице и выбираем опцию «Просмотреть исходный код страницы».

Затем я хочу обработать этот контент для извлечения некоторых релевантных значений.

Я пробовал несколько вариантов в редакторе Try3t W3schools, но ничего не получалось. Я пробовал и для других URL-адресов, но не повезло.

Может кто-нибудь сказать, если это возможно с использованием HTML и JavaScript, и если да, то как?

Ответы [ 2 ]

0 голосов
/ 17 октября 2019

Каковы основные цели загрузки другой страницы на вашу страницу?

С другой стороны, пытались ли вы использовать iframes?

https://www.w3schools.com/tags/tag_iframe.asp

https://developer.mozilla.org/en-US/docs/Web/HTML/Element/iframe

Примечание. В конце концов, вы можете получить страницу, но не сможете управлять js.

0 голосов
/ 17 октября 2019

Вы можете сделать HTTP-запрос, используя Fetch API, довольно просто:

const res = await fetch('https://example.com');
const html = await res.text();

Однако это будет работать только для URL-адресов, которые позволяют вам получать их источники из разных источников. По соображениям безопасности это не распространено. (Если бы это было так, большинство других веб-сайтов могло бы украсть контент с других сайтов, на которых вы вошли, таких как ваша веб-почта или ваш банк!)

Единственный способ обойти это - прокси на стороне сервера данных, гдепроблема перекрестного происхождения не существует.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...