Я предполагаю, что вы пишете приложение node.js. (Из-за ограничений безопасности на том же сайте проверка, которую вы хотите выполнить, будет заблокирована только для веб-сайта хостинга в случае сценария браузера).
Предполагается, что вы пишете приложение Node, операция, которую вы хотите выполнить, это называется «выскабливание» (действительно простая версия выскабливания). Существует множество библиотек для Node, которые могут вам помочь. Одним из них является Cheerio .
Первым делом загрузите содержимое URL в строку, вы можете скопировать код из этого ответа для этого.
Второй проанализируйте строку с помощью cheerio и извлеките ссылки, как вам нужно, что-то вроде:
const cheerio = require('cheerio')
const $ = cheerio.load(webPageLoadedContent)
$('a').filter(function(i, el) {
return $(this).attr('href').includes('mywebsite.com/offers')
})
Это процедура для отдельной веб-страницы. Чтобы развернуть сайт целиком, вы должны повторно применять его к каждому найденному URL (фильтрация по названию сайта).