Получите необоснованный источник из браузера после нажатия - PullRequest
0 голосов
/ 02 декабря 2010

На веб-странице есть некоторое содержание, запутанное каким-то изощренным способом (по крайней мере, для меня).Я не могу расшифровать его со страницы источника.В любом случае, при нажатии на ссылку на странице вызывается java-функция onclick, и страница становится читаемой.В этот момент также сгенерированный источник в браузере доступен для чтения.

Существует ли инструмент программирования (например, Mechanize или sth., Предпочтительно perl), который бы загружал страницу в Firefox, нажимал ссылку и затем получалunchipered html?

Есть предложения, как решить эту проблему?

Ответы [ 3 ]

1 голос
/ 14 июля 2011

Попробуйте использовать Chrome и проверьте опцию deobfuscate source в инструментах разработчика, просмотрщик javascript.

0 голосов
/ 02 декабря 2010

Попробуйте дополнение greasemonkey для firefox.

Вы можете написать небольшую функцию javascript, которая нажимает эту кнопку для вас, например, каждый раз, когда вы загружаете страницу в Firefox. Для начала ознакомьтесь с userscripts.org.

Это будет работать (внутри вашего браузера) только для одного клиента, и это вы.

Если вам нужна полная автоматизация, вы можете попробовать записать тестовый набор Selenium. Для этого вы можете использовать другое дополнение Firefox, «Selenium IDE» (ветераны Microsoft Office назвали бы это «Macro Recorder»), и даже преобразовать записанный тестовый пример в код Perl.

(Запуск тестового примера потребует запуска еще одного небольшого компонента, selenium rc (сервер на базе Java), который запустит Firefox для вас и перейдет по ссылке.

0 голосов
/ 02 декабря 2010

Я бы использовал Firebug для просмотра деобфускированного кода.

При просмотре исходного кода браузеры покажут вам исходный исходный , а не текущий DOM.Когда вы просматриваете источник с помощью Firebug, он покажет вам текущий источник, который будет отображать ваш браузер.

Этот подход будет работать, только если вы хотите увидеть HTML, а не если вам нужен программныйэкстракция.

...