Вы можете попытаться очистить исходный HTML-код, поскольку на самом деле очистить визуализированный HTML-код крайне сложно, вам придется использовать браузер без головы.
Есть эта библиотека: https://github.com/tautologistics/node-htmlparser, которую вы можете использовать для анализа HTML из JavaScript, она находится в узле, но поскольку она не использует никаких зависимостей, вы можете просто скопировать и вставить нужные вам функции.
Парсинг, боюсь, это не очень простая задача.