Это будет брутто ... и, скорее всего, сломается за короткий промежуток времени. Но без API лучшим способом было бы сделать запрос Ajax с XMLHttpRequest, а затем проанализировать сайт с помощью javascript или jQuery на основе классов разметки сайтов и идентификаторов.
Важно, что вы просматриваете сайт.
Хотя это сработает, вероятно, оно не будет стоить вашего времени - если сайт хорошо спроектирован, классы разметки и идентификаторы не должны сильно меняться, это будет CSS, который изменится. Но это не гарантируется командой разработчиков сайта. API - это скорее гарантия, и я бы не стал тратить много времени на очистку сайта, не предоставляющего API, потому что, скорее всего, разметка изменится по мере роста компании и найма инженеров.
Удачи, хотя!