Предотвращение сканирования и копирования данных сайта - PullRequest
15 голосов
/ 07 октября 2008

Я собираюсь создать контент-сайт, возможно, с тысячами различных записей, доступных по индексу и поиску.

Какие меры я могу предпринять, чтобы не дать вредоносным сканерам удалить все данные с моего сайта? Меня меньше беспокоит SEO, хотя я бы не хотел блокировать законных сканеров все вместе.

Например, я думал о случайном изменении небольших битов структуры HTML, используемой для отображения моих данных, но я думаю, что это не очень эффективно.

Ответы [ 12 ]

0 голосов
/ 07 октября 2008

Вы можете попробовать использовать Flash / Silverlight / Java для отображения всего содержимого вашей страницы. Это, вероятно, остановит большинство сканеров на их пути.

0 голосов
/ 07 октября 2008

Используйте, где это возможно, человеческие валидаторы и попробуйте использовать какой-нибудь фреймворк (MVC). Программное обеспечение копирования сайта иногда не может скопировать такую ​​страницу. Также обнаружите пользовательский агент, по крайней мере это уменьшит количество возможных рипперов

...