Похоже, что очистка страниц в Интернете стала для меня чем-то вроде стены, поскольку все больше и больше сайтов зависят от JavaScript для отображения частей экрана.
Мне кажется, что с таким количеством выпущенных макетов с открытым исходным кодом и рендерингами JavaScript (например, WebKit , Gecko и Chromium + V8 ) что кто-то должен был создать инструмент для загрузки страницы и рендеринга ее JavaScript без необходимости запуска реального браузера. Тем не менее, я не показываю то, что я ищу в своих поисках - я нашел такие инструменты, как Selenium-rc , но они зависят от работающего браузера. Меня интересует любой инструмент или библиотека, которые могут выполнять одно (или оба) из следующего:
Программа, которая может быть запущена из командной строки (* nix), которая, учитывая источник страницы, возвращает исходный код страницы в том виде, в каком он был обработан каким-либо механизмом JS.
Интегрированная поддержка на определенном языке, которая позволяет (легко) передавать на него исходный код страницы и возвращает исходный код страницы в том виде, в каком он был предоставлен некоторым механизмом JS.
Я думаю, что # 1 предпочтительнее в общем смысле, но # 2 было бы более полезно, если бы инструмент существовал на языке, на котором я хочу работать. Кроме того, меня не интересует конкретный движок JS - любой относительно современный один сделает. Что там?