Question

Друг спросил меня об этом, и я не смог ответить.

Он спросил: я делаю этот сайт, где вы можете заархивировать свой сайт ...

Это работает следующим образом: вы заходите на свой сайт, как то, что-то, а затем наш сайт захватывает контент на этом сайте, как изображения, и все это и загружает его на наш сайт. Тогда люди смогут просмотреть точную копию сайта по адресу oursite.com/something.com, даже если сервер, на котором размещен что-то.com, не работает.

Как он мог это сделать? (php?) и какие будут некоторые требования?

Michael Aaron Safyan · Answer 1 · 01 августа 2010

Похоже, вам нужно создать веб-сканер.Сканеры могут быть написаны на любом языке, хотя я бы порекомендовал для этого использовать C ++ (с использованием cURL), Java (с использованием URLConnection) или Python (w / urrlib2).Вы также можете быстро взломать что-нибудь вместе с командами curl или wget и BASH, хотя это, вероятно, не лучшее долгосрочное решение.Кроме того, не забывайте, что вы должны загружать, анализировать и уважать файл «robots.txt», если он присутствует всякий раз, когда вы сканируете чей-то сайт.

Zimbabao · Answer 2 · 01 августа 2010

Получить HTML с помощью curl.
Теперь измените все изображения, CSS, Javascript на абсолютные URL, если они являются относительными URL. (Это немного неэтично). Вы можете получить все эти ресурсы и разместить на своем сайте.
Уважайте robots.txt всех сайтов. читайте здесь .

Femaref · Answer 3 · 01 августа 2010

Используйте wget. Либо версия linux, либо версия windows из пакета gnuwin32. получите это здесь .

Как «захватить» контент с другого сайта

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как «захватить» контент с другого сайта

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы