Мне нужно автоматизировать что-то вроде этого:
- Открыть URL
- Дождаться полной загрузки страницы
- Сохранить ПОЛНУЮ страницу как ... (могу указать имя).
Я видел https://developer.mozilla.org/en/Command_Line_Options, но не могу найти опцию для вызова команды "сохранить страницу как ... (в режиме веб-страницы завершена)". Так что я могу иметь все css, js, xml и связанные файлы, необходимые для отображения страницы.
Я знаю некоторый Python, который мог бы использовать его, если я найду способ «поговорить» с Firefox. Модуль веб-браузера здесь не поможет, так как не позволяет сохранить страницу: http://docs.python.org/library/webbrowser.html
Я открыт для любого решения.
Платформа: Linux, но я мог бы использовать другой, если нет другого пути.
Важно : Я не могу просто получить HTML-код, предоставленный веб-сервером, поскольку мне нужны все файлы CSS, JS, изображения и файлы, которые используются для просмотра страницы в том виде, в каком она отображается в браузере. Например, изображение может быть не связано в HTML, но на него ссылается js , которое выполняется при визуализации страницы. Единственный способ, которым я думаю, что я могу получить это изображение, это выполнить страницу, как если бы я был браузером, а затем получить все файлы с результирующей страницы (а не исходной страницы).