сохранить веб-страницу entere, используя ruby ​​(clojure или javascript) - PullRequest
0 голосов
/ 07 августа 2011

У меня проблема. Я работаю с поставщиком продуктов питания, и мне нужно сохранить содержимое каждого заказа в виде HTML. Заказы перечислены на одной странице в виде ссылок, но это имеет 2 трудности

  1. Страница использует аутентификацию (необходимо войти в систему заранее)
  2. Это реальная проблема: на странице много javascript. На самом деле все работает без изменения веб-адреса, поэтому я не могу использовать wget или rio gem (url не такой как www.fooddoe.com/order, www.fooddoe.com/order/1 и т. Д., Но всегда как www.fooddoe.com/suplierx).

Я думаю, что Firewatir был бы хорошим вариантом, но проблема в том, что мне нужно сохранить страницу в формате, похожем на HTML (включая изображения). Возможно ли использовать firewatir? Есть ли другие варианты в clojure или javascript?

Большое спасибо !!

1 Ответ

3 голосов
/ 07 августа 2011

Мне пришлось дважды прочитать ваш вопрос, чтобы понять, что вы имеете в виду.

Из веб-адреса из примера, я предполагаю, что это ваша веб-страница поставщика. Так что ИМХО самый простой способ это:

  1. Посмотрите на источник веб-страницы, чтобы понять, как она получает данные (99% для какого-то AJAX-запроса).
  2. Запрос отправляется на сервер, который на него отвечает.
  3. Теперь есть два способа:
    • Получить представление о том, как делается запрос, написать и приложение, чтобы сделать такой запрос и создать веб-страницу с ним (более сложный, более общий)
    • Свяжитесь с поставщиком и получите оригинальную базу данных (более простое, но одноразовое решение)

И я думаю, что это не вопрос, специфичный для какого-либо языка.

...