Для Python посмотрите Beautiful Soup , библиотеку HTML-парсера, которая может помочь вам очистить веб-страницы.Возможно, это не сработает, если страница будет отображаться на стороне клиента (будет получен только необработанный HTML, поэтому, если на веб-сайте есть JavaScript, генерирующий HTML динамически, вам понадобится что-то вроде Selenium или некоторая оболочка для движка веб-рендеринга, такого как WebKit).