определить, есть ли у сайта электронная коммерция в Node.js - PullRequest
0 голосов
/ 25 марта 2019

Мне нужно программно определять, есть ли на сайте платформа / система электронной коммерции Мне не нужно знать, какой именно, мне просто нужно знать, есть ли на сайте. (У меня есть большой список сайтов, поэтому мне, вероятно, нужно их почистить) Будем очень благодарны за любые предложения о том, как я могу сделать это без с помощью внешних сайтов (например, rescan.io/builtwith/etc)! спасибо!

1 Ответ

0 голосов
/ 25 марта 2019

Вы можете использовать пакет под названием Puppeteer, который используется для очистки веб-страниц в node.js.

Я не знаю, какие платформы вы пытаетесь найти, но я думаю, вы могли бы попробовать что-то вроде предоставления списка сайтов, которые вы хотите проверить, процессу node.js и попросить Puppeteer очистить их все. Затем вы просматриваете возвращаемый контент и, например, ищите CDN от Shopify в тегах или проверяете теги на наличие ключевых слов.

Вам обязательно нужно будет проверить каждую отдельную платформу, такую ​​как Magento или Shopify, на наличие уникального исходного кода, который четко отличает платформу, на которую вы смотрите, от других инструментов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...