Поскольку содержимое вашей страницы генерируется неким Javascript, вам нужна способность:
- Выполнить некоторый код Javascript
- Даже, возможно, какой-нибудь сложный код JS, выполняющий Ajax-запросы и все такое?
- И сделать это с движком, который поддерживает функции / методы, присутствующие в браузере (например, манипуляции с DOM)
Решение может состоять в том, чтобы действительно запустить браузер для перехода на эту страницу, а затем проанализировать загруженную им страницу для извлечения информации?
Я никогда не использовал это для захвата, но Selenium Suite *1019* может помочь, здесь: используя Selenium RC, вы можете запустить настоящий браузер и запустить его - тогда у вас есть функции, чтобы получить данные из него.
Это не совсем быстро и довольно тяжело (нужно запустить браузер!) , но работает довольно хорошо: вы будете использовать Firefox, например, для перехода на свою страницу - - что означает настоящий движок Javascript, который каждый день используется многими людьми; -)