Как я могу очистить сайт ASP.NET, который выполняет все взаимодействия, как обратные передачи? - PullRequest
1 голос
/ 04 апреля 2011

Используя Python, я создал скребок для сайта ASP.NET (в частности, портлета поиска курса Jenzabar), который будет создавать новый сеанс, загружать первую страницу поиска, а затем моделировать поиск, отправляя обратно необходимые поля.Однако что-то изменилось, и я не могу понять, что, и теперь я получаю ответы HTTP 500 на все.Я не вижу новых полей в данных POST браузера, которые я вижу.

В идеале я бы хотел выяснить, как починить мой собственный скребок, но об этом, вероятно, трудно спросить в StackOverflow, не добавив тонныспецифический контекст, поэтому мне было интересно, есть ли способ трактовать страницу как черный ящик и просто запускать события щелчка по нужным ссылкам обратной передачи, а затем получить HTML-код результата.

Я видел некоторые ответыздесь о чистке с помощью JavaScript, но они в основном сосредоточены на ожидании загрузки javascript и возвращении нормализованного представления страницы.Я хочу смоделировать браузер, фактически нажимающий на ссылки и следующий по тому же пути, чтобы выполнить запрос.

Ответы [ 4 ]

1 голос
/ 04 апреля 2011

Не зная каких-либо подробностей, я догадываюсь, что вы используете жестко закодированный идентификатор сеанса, а домен приложения веб-сервера перерабатывается и создаете новые ключи шифрования / дешифрования, что делает ваш жестко закодированный идентификатор сеанса (который был зашифрован старыми ключами) бесполезным.

0 голосов
/ 06 апреля 2011

Вы видели эту статью, где я упоминал об использовании HtmlUnit с Jython? Нажмите на ссылку JavaScript с Python?

0 голосов
/ 04 апреля 2011

Если вы просто пытаетесь смоделировать нагрузку, вы можете попробовать что-то вроде селена, который запускается через браузер и обрабатывает обратные вызовы, как браузер.

0 голосов
/ 04 апреля 2011

Вы можете попробовать использовать вкладку Firebugs NET для отслеживания всех запросов, просмотра вручную, а затем сопоставления запросов, которые вы генерируете, с запросами, генерируемыми вашим скребком.

...