Я ищу способ, дать URL, вернуть источник веб-страницы после того, как на ней был запущен JavaScript. Например:
У меня есть веб-страница с.
При загрузке страницы некоторый JavaScript заполняет div.
Просмотр источника страницы через браузер не даст информацию, которая находится внутри div.
Насколько я знаю, для того, чтобы браузер отображал страницу, div должен быть заполнен (X | D) HTML, что означало бы, что источник страницы после визуализации все еще является просто вложенной разметкой, поэтому теоретически должна быть «окончательная» версия страницы источника.
Я рассмотрел использование механизма рендеринга, такого как WebKit или Gecko, и как-то адаптировать их для этого, однако это довольно большая задача, и я не хочу дублировать что-то, что уже было сделано. Кто-нибудь знает способ выполнения этой задачи.
Привет.
Обновление: я намерен использовать Selenium (как указано в комментариях к принятому ответу), чтобы сделать это автоматически на нескольких страницах. Мой проект - это веб-паук, который по своему замыслу должен быть нацелен на несколько страниц, на которых контент, к которому я стремлюсь, недоступен до тех пор, пока JavaScript не заполнит все.