Я пытался очистить и в конечном итоге проанализировать некоторые данные (в частности, наличие и стоимость) с hostels.com, например http://www.hostels.com/hosteldetails.php/HostelNumber.11890. Проблема в том, что после выбора количества ночей и выбора «Забронировать сейчас» ничего не передается через строку URL (все это делается через Ajax, я верю), я не могу перейти непосредственно к определенной дате или временному интервалу.
Я пытался использовать браузерные эмуляторы, такие как Selenium, IRobotSoft и FakeApp, и хотя мне удалось заставить Selenium и Fake выполнять большую часть работы, захватывая полный исходный код, это было уродливо и все еще утомительно, когда приходилось чистить (и анализировать с другим программным обеспечением) ) несколько страниц в день.
Я также пробовал HTML DOM Parser, PHP Scriptable Web Browser, HTMLUnit, cScrape.php, Crowbar. Либо они не могли справиться с Аяксом, либо мне не повезло заставить их даже бежать.
В идеале я хотел бы, чтобы что-то могло запускаться с сервера, с как можно меньшим количеством зависимостей, но на данный момент я просто хотел бы запустить его.
Теперь, проведя много часов, пытаясь заставить это работать. Я все еще чувствую, что не знаю, с чего начать. Может кто-то просто указать мне правильное направление? Должен ли я вернуться и провести больше времени с HTMLUnit? Какую практику лучше использовать для такого сайта?
Спасибо