Я думаю, вам лучше скопировать на сервер то, что у вас есть на стороне клиента.Хотя это может показаться неэффективным мероприятием, оно, по крайней мере, имеет четкую и ограниченную область применения.
Большинство авторитетных безголовых браузеров предназначены для тестирования приложений при разработке приложений.Соответственно, они очень открыты в своей структуре, что хорошо, если вы отвечаете за контроль качества приложения, но не так много, если вы хотите сделать только одну конкретную вещь с ним.
Я использовал Selenium-RC , чтобы сделать только одну конкретную вещь в конкретном проекте, и обнаружил, что решение всех проблем, связанных с Селеном, быстро стало проектомк себе.Хотя Selenium-RC, безусловно, может выполнить то, что вы пытаетесь сделать, это кажется большим обязательством, учитывая специфику того, чего вы хотите достичь.
(Будучи полностью любителем Java, я могуНа самом деле не комментируйте HTMLUnit , но только по одной спецификации, кажется, что это, вероятно, более подходит для ваших нужд, чем Selenium-RC. Меня это не удивит, хотя, если бы он имел некоторые настройки итребования управления.)
Итак, вернемся к альтернативе дублирования всего в PHP ...
Имейте в виду, что вам не нужно, чтобы все было точно идентично в снимках HTML, как это было быбыть в браузере: пока у вас есть основной контент и ключевые навигационные ссылки, у GoogleBot будет почти все, что ему нужно.Вам также нужно индексировать каждую страницу на вашем сайте?Или вы могли бы определить несколько наиболее важных маршрутов и просто предоставить их снимки?Вы также можете использовать веб-аналитику или данные журнала сервера, чтобы лучше определять приоритеты моментальных снимков.