Используйте Node.js и исправьте все, что его сбивает. Он работает на моем Ubuntu-боксе без проблем уже несколько месяцев.
Для библиотеки я рекомендую использовать YUI3 вместо jQuery, она легко позволяет создать веб-сканер / скребок за пару минут, если вы не верите мне, посмотрите этот разговор с YUIConf2010, это 40 минут, но все дело в коде.
Дэв Гласс (David Glass) отлично показал, насколько это просто и как мало кода вам нужно, да, в докладе были некоторые проблемы с другой версией jsdom, но речь шла в начале ноября, поэтому это должно быть уже исправлено.
Вы можете посмотреть все материалы из выступления на его странице GitHub .
А вот его скребок , который получает текущие заголовки новостей от Digg.
Серьезно, это стоит того, чтобы заставить Node.js работать в вашей системе, так как в итоге вы получили всю прелесть YUI3 на стороне сервера.