Что вы просите сделать в в этом случае сложно. Не невозможно, но сложно.
метод А:
Вы можете просмотреть их код JavaScript. Их «ajax» делает запрос get / post на другую веб-страницу и динамически загружает результаты. Если вы можете расшифровать, что это за ссылка и правильные аргументы, вы можете продолжать использовать get. Я бы рекомендовал получить плагин firebug и любой другой инструмент, который поможет вам де-запутать их javascript.
Другой метод:
Если ваша программа может получить доступ к веб-браузеру (с поддержкой URL Javascript. Как Firefox). Вы можете программно перейти по этим адресам, затем подождать и получить данные.
http://wro.westchesterclerk.com/legalsearch.aspx
javascript: function go() { document.getElementById('ctl00_tbSearchArea__ctl1_cphLegalSearch_splMain_tmpl0_tbLegalSearchType__ctl0_txtInde xNo').value=11109; document.getElementById('ctl00_tbSearchArea__ctl1_cphLegalSearch_splMain_tmpl0_tbLegalSearchType__ctl0_txtYear').value='09';searchClick();} go();
Это метод, который мы использовали вместе с mozembed , чтобы программно обойти это. Недавно мы перешли на Web Kit . И чтобы убрать это из памяти, мы использовали Xvfb / Xvnc, чтобы создать виртуальный рабочий стол для загрузки браузера.
Это методы, которые я придумал до сих пор. Дайте мне знать, если вы придумали другой. Также я надеюсь, что помог.