фильтрация загруженного извне JavaScript в htmlunit - PullRequest
4 голосов
/ 24 июля 2011

При использовании htmlunit для очистки веб-страницы я иногда замечаю подобные предупреждения, которые заполняют вывод консоли.

Jul 24, 2011 5:12:59 PM com.gargoylesoftware.htmlunit.javascript.StrictErrorReporter warning
WARNING: warning: message=[Calling eval() with anything other than a primitive string value 
will simply return the value. Is this what you intended?] sourceName=[http://ad.doubleclick.net/adj/N5762.morningstar.com/B5553006.25;sz=728x90;click0=http://ads.morningstar.com/RealMedia/ads/click_lx.ads/www.morningstar.com/quicktake/fund/L34/648978540/TopLeft/Morningstar/JPM_FRpt_728x90_Jul_3827448/Fund_Reports_728x90_content.html/656d5477595534723465554144664a2b?;ord=648978540?] line=[356] lineSource=[null] lineOffset=[0]

Есть ли способ, которым я могу htmlunit игнорировать JavaScript из

или даже просто

Аналогично, есть ли способ заставить htmlunit интерпретировать только JavaScript на веб-странице, содержащей определенную подстроку или соответствующую регулярному выражению?

1 Ответ

2 голосов
/ 09 февраля 2013

Возможно, вы сможете удалить нежелательный JavaScript, внедрив свой собственный ScriptPreProcessor .Ваш ScriptPreProcessor может обнаружить jsvascript, который вы не хотите выполнять, и затем удалить его с веб-сайта.

Я еще не пробовал, но может работать.

...