Итак, наконец, вы можете попробовать это http://github.com/eugenehp/node-crawler
В противном случае вы можете попробовать следующий подход с PhantomJS
Самый простой способ - это загрузить страницу -> разобрать страницу -> исключить нежелательный ресурс -> загрузить его в PhatomJS.
Другой способ - просто заблокировать хосты в брандмауэре.
При желании вы можете использовать прокси-сервер для блокировки определенных URL-адресов и запросов к ним.
И еще один, загрузите страницу, а затем удалите ненужные ресурсы, но я думаю, что это не правильный подход.