Как получить контент с других сайтов - PullRequest
1 голос
/ 02 апреля 2012

Существует так много публичных веб-сайтов, которые отображают весь сайт в виде рамки на своем сайте. Например: - Проверьте прокси-сайты, в которых есть рамка и поле, в котором мы вводим URL. После ввода URL-адреса эти сайты извлекают всю HTML-страницу и отображают ее в своем окне. Я хочу узнать, как они выполняют это. Разве они не сталкиваются с проблемой XSS? Пожалуйста, помогите мне понять и научиться. :)

Ответы [ 3 ]

3 голосов
/ 02 апреля 2012

Прежде всего, вы не должны чистить чужие сайты и показывать их в своем собственном фрейме.

вы можете получить все содержимое URL , используя инструмент cURL

Если вы можете кодировать на Java, используйте Apache HTTPClient library

0 голосов
/ 02 апреля 2012

Ограничения на межсайтовый скриптинг (XSS) имеют отношение только к JavaScript.Проблема в том, что на ваш сайт может быть вставлен произвольный исполняемый код без ограничений.Есть много способов связать контент с других сайтов с вашим;эта идея является одной из основных идей WWW.
Одна из многих возможностей заключается в том, что они используют Framing , например, с iframes: <iframe src="someone-elses-website.com">.

0 голосов
/ 02 апреля 2012

Вы можете попробовать, например, модуль urllib в python, чтобы очистить сайты по их URL, но будьте осторожны с вещами, которые вы не должны делать. Всегда будьте в курсе условий. Помните, с великой силой приходит большая ответственность.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...