Любая питерская "очищающая" библиотека вряд ли сможет интерпретировать javascript для вас на appengine, поскольку для нее, вероятно, потребуется какое-то расширение C (например, привязка к spidermonkey или v8), которое будет против песочницы GAE.
Но, если вы решитесь перейти на сторону Java, вам может повезти больше.Я знаю, что вы можете получить Rhino, работающий на AppEngine , с небольшой помощью env.js вы можете эмулировать DOM, быстрый Google показывает кучу инструментов для очисткиJava .Это просто вопрос связывания всего этого вместе.
HtmlUnit Похоже, что он пытается сделать именно это, но неясно, является ли он в настоящее время дружественным к приложениям, поскольку кажется, что он многопоточный.