Рендеринг URL с использованием командной строки / оболочки с использованием Javascript (Jive Server) для последующей обработки - PullRequest
3 голосов
/ 26 октября 2011

У меня следующая ситуация.

Мы используем систему документации на основе LaTeX, которая должна получать информацию, размещаемую на веб-странице Jive (Clearspace). Эта информация предоставляется на веб-странице в Javascript, которая не может быть правильно отображена с использованием обычных инструментов, таких как cURL, wget или lynx.

Я ищу какие-то средства, чтобы сделать следующее (предпочтительно bash / командной строки)

1) Войдите на сервер Jive с соответствующими учетными данными (возможно, потребуется сохранить куки-файл) 2) Доступ к конкретной странице и сбросить соответствующую информацию в текстовый файл

Есть идеи / предложения? Обычно я делаю большинство этих автоматизированных процедур, используя bash, потому что это значительно упрощает интеграцию с LaTeX (скомпилировано с помощью командной строки). Тем не менее, я открыт для других маршрутов с небольшим руководством.

1 Ответ

2 голосов
/ 26 октября 2011

Можно публиковать и сохранять куки с помощью wget (и, вероятно, cURL).Вот пример со страницы руководства wget:

 wget --save-cookies cookies.txt \
                        --post-data 'user=foo&password=bar' \
                        --keep-session-cookies
                        http://server.com/auth.php

Вы можете сделать следующий запрос к странице, которая отображает данные с помощью

 --load-cookie cookies.txt

Что касается выяснения, что ставитьв опции post-data я рекомендую установить отладочный прокси, например fiddler2 .Это облегчит понимание всей структуры http-сообщений, отправляемых на сервер, и позволит вам перепроектировать формы.

...