Вы пытаетесь иметь дело только с Amazon?
В любом случае, с Amazon вам лучше всего использовать их API, есть библиотека, которая позволяет довольно быстро и легко работать с CloudFusion . Мне понадобилось около 15 минут, чтобы извлечь из них полезные данные, когда я впервые использовал их несколько недель назад, и большую часть этого времени было потрачено на регистрацию ключей API Amazon, здесь есть хорошее руководство , которое поможет вам в этом. ,
BestBuy также имеет API под названием ReMix , который, по-видимому, неплох, хотя я никогда не использовал его сам.
Если вам нужно иметь дело и с другими сайтами, у меня были хорошие результаты, используя PHP Simple HTML Dom Parser , но вам нужно следить за тем, как это делается, просто потому что редизайн сайта скорее всего сломает ваш синтаксический анализатор.