Получение окончательного / временного рендера URL - PullRequest
0 голосов
/ 02 июня 2009

Я ищу способ, дать URL, вернуть источник веб-страницы после того, как на ней был запущен JavaScript. Например:

У меня есть веб-страница с. При загрузке страницы некоторый JavaScript заполняет div. Просмотр источника страницы через браузер не даст информацию, которая находится внутри div.

Насколько я знаю, для того, чтобы браузер отображал страницу, div должен быть заполнен (X | D) HTML, что означало бы, что источник страницы после визуализации все еще является просто вложенной разметкой, поэтому теоретически должна быть «окончательная» версия страницы источника.

Я рассмотрел использование механизма рендеринга, такого как WebKit или Gecko, и как-то адаптировать их для этого, однако это довольно большая задача, и я не хочу дублировать что-то, что уже было сделано. Кто-нибудь знает способ выполнения этой задачи.

Привет.

Обновление: я намерен использовать Selenium (как указано в комментариях к принятому ответу), чтобы сделать это автоматически на нескольких страницах. Мой проект - это веб-паук, который по своему замыслу должен быть нацелен на несколько страниц, на которых контент, к которому я стремлюсь, недоступен до тех пор, пока JavaScript не заполнит все.

Ответы [ 2 ]

1 голос
/ 02 июня 2009

Такие дополнения для Firefox, как Панель инструментов WebDev или Firebug , имеют параметры, такие как «Просмотр сгенерированного источника».

Что касается времени, то практически единственный вариант, который у вас есть, это иметь фрагмент кода javascript. Вы можете установить время запуска при загрузке страницы как можно скорее и еще раз проверить, когда страница завершена (либо для dom-ready, либо для страницы, полностью загруженной). Однако он будет сильно изменчивым, и если вы попытаетесь рассчитать время, чтобы улучшить скорость (что полезно знать и делать) - просто получить Firebug + Yslow было бы гораздо полезнее .

0 голосов
/ 02 июня 2009

В Firefox вы можете получить окончательно отрендеренный DIV, подождав, пока браузер завершит рендеринг, затем нажмите Ctrl-A, чтобы выбрать весь контент на странице, и, наконец, выберите «Показать источник выделения» в меню правой кнопки мыши.

Показывает манипулированный / заполненный DOM-код страницы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...