Как написать скрипт для Firefox или любого браузера на базе Mozilla - PullRequest
12 голосов
/ 06 октября 2010

Мне нужно автоматизировать что-то вроде этого:

  1. Открыть URL
  2. Дождаться полной загрузки страницы
  3. Сохранить ПОЛНУЮ страницу как ... (могу указать имя).

Я видел https://developer.mozilla.org/en/Command_Line_Options, но не могу найти опцию для вызова команды "сохранить страницу как ... (в режиме веб-страницы завершена)". Так что я могу иметь все css, js, xml и связанные файлы, необходимые для отображения страницы.

Я знаю некоторый Python, который мог бы использовать его, если я найду способ «поговорить» с Firefox. Модуль веб-браузера здесь не поможет, так как не позволяет сохранить страницу: http://docs.python.org/library/webbrowser.html

Я открыт для любого решения.

Платформа: Linux, но я мог бы использовать другой, если нет другого пути.

Важно : Я не могу просто получить HTML-код, предоставленный веб-сервером, поскольку мне нужны все файлы CSS, JS, изображения и файлы, которые используются для просмотра страницы в том виде, в каком она отображается в браузере. Например, изображение может быть не связано в HTML, но на него ссылается js , которое выполняется при визуализации страницы. Единственный способ, которым я думаю, что я могу получить это изображение, это выполнить страницу, как если бы я был браузером, а затем получить все файлы с результирующей страницы (а не исходной страницы).

Ответы [ 4 ]

4 голосов
/ 06 октября 2010

Возможно, вам подойдет что-то из набора Selenium .

Selenium IDE - это интегрированная среда разработки для сценариев Selenium.Он реализован как расширение Firefox и позволяет записывать, редактировать и отлаживать тесты.Selenium IDE включает в себя все Selenium Core, что позволяет легко и быстро записывать и воспроизводить тесты в реальной среде, в которой они будут выполняться.

1 голос
/ 07 октября 2010

Могут быть использованы другие альтернативы Селену

И некоторые вещи, написанные поверх этого

0 голосов
/ 17 сентября 2013

Взгляните на программное обеспечение iMacros: http://www.iopus.com/imacros/ Его плагин Firefox бесплатный.

0 голосов
/ 06 октября 2010

Если вы пытаетесь сохранить какой-либо URL в файл на Python, хороший ответ может быть urllib.urlretrieve

http://docs.python.org/library/urllib.html

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...