Многие интернет-магазины предоставляют файл карты сайта, который содержит информацию о своих продуктах в виде:
...
<url>
<loc>http://blabla.com/tbcart/pc/-DOOR-GYM-Full-Body-Exerciser-256p34168.htm</loc>
<lastmod>2010-11-26</lastmod>
<changefreq>weekly</changefreq>
</url>
...
Но для работы онлайн-службы сравнения цен необходимы фактические цены на товары в дополнение к их URL.,Предполагая, что типичная карта сайта для интернет-магазина содержит 20 000 URL-адресов, как бы вы действовали в получении фактических цен для каждого продукта?Это то, как карта сайта должна использоваться для получения цен на товары?
Весьма вероятно, что выполнение 20'000 запросов Http Get приведет к тому, что интернет-магазин заблокирует IP-адрес сканера:)
Спасибо,
PS - Какбудет этот масштаб?Как карта сайта с 50'000 ссылками, скажем, нужно переиндексировать каждое воскресенье, это подразумевает отправку 1 запроса каждые 2 секунды в течение всего дня. Как можно избежать блокировки в этой ситуации?