Зависит от того, сколько времени у злоумышленника на получение данных. Если большая часть данных является статической, злоумышленнику может быть интересно запустить свой скребок, скажем, в течение 50 дней. Если он находится на линии DSL, где он может запрашивать «новый» IP-адрес два раза в день, ограничение в 1% не нанесет ему такого вреда.
Конечно, если вам нужны данные быстрее (потому что они быстро устарели), есть лучшие способы (использовать экземпляры EC2, настроить проект BOINC, если есть интерес общественности к собранным данным и т. Д.).
Или есть схема Pyramid а-ля «получить 10 людей, чтобы запустить свой искателю, и вы получите ПОРНО, или получить 100 человека, чтобы сканировать его, и вы получите МНОГО порнухи», как это было довольно распространенным явлением несколько лет назад с Ad- заполненные сайты. Из-за конкуренции (которая получает наибольшее количество рефералов) вы можете быстро получить множество узлов, работающих на вашем сканере, за очень небольшие деньги.