Я пытаюсь найти все экземпляры рекламы на сайте. Реклама находится в iframe, который загружается с помощью javascript (он не отображается вообще, если javascript отключен). Обнаружение самой рекламы чрезвычайно просто, и имя файла флеш-памяти, и цель href всегда содержат определенную строку.
Что было бы лучшей «отправной точкой» для достижения этого? В данный момент я рассматриваю приложение Adobe AIR, которое может сканировать сайт и проверять DOM, чтобы найти объявление, а также запускать javascript и загружать содержимое iframe. Другой вариант, который я могу придумать, - это использовать Firefox в качестве платформы (возможно, с помощью GreaseMonkey или Selenium? Я действительно не знаю, как использовать Firefox таким образом).
Кто-нибудь знает что-нибудь подходящее для создания этого или есть какие-либо предложения по использованию Firefox для этого?
Дополнительные детали:
Интенсивная загрузка ЦП не является проблемой и не зависит от того, какой браузер открыт. Это не нужно запускать на автономном сервере, оно будет работать на мощном настольном компьютере. ОС тоже не проблема. Было бы полезно, если бы сканер загружал каждую страницу несколько раз, так как реклама находится в ротации. Хотя сканер должен выполнить javascript и загрузить содержимое iframe, он не должен отображать флэш-файлы.