Существует множество доступных сканеров с открытым исходным кодом на основе Java и python, которые вы можете настроить в соответствии со своими требованиями, некоторые из которых указаны ниже.
Apache Nutch
StormCrawler
Jsoup
Jaunt
в вашем случае, так как вам нужен толькоцену на странице продукта вы можете создать самостоятельно, используя JSoup, фреймворк, доступный в Java, или модуль Beautiful Soup в Python.
, если масштаб не имеет значения, и вы просто хотите сканировать некоторые страницы ежедневноЯ рекомендую создать свой собственный гусеничный ход.в противном случае вы можете использовать Nutch или StormCrawler
. Также для нестандартных приложений не используйте несколько селекторов для разных веб-страниц, просто найдите общий тег, CSS или шаблон, который даст вам цену.