Я бы сказал, что страницы AMP определенно легче очищать из-за того, что практически нет специального кода JS.Многие сайты вставляют контент с помощью JS или AJAX.AMP ограничивает количество библиотек, которые вы можете использовать, и, следовательно, их меньше по сравнению с обычным сайтом.
Кроме того, если вы хотите очистить контент, написанный на JavaScript, вы должны использовать Selenium.Если нет, то PHP - это путь (ИМХО) или BeautifulSoup в Python.
Удачи!