По-моему, это просто вопрос масштаба. Если вы пишете простой скребок для личного использования или просто что-то, что будет запускаться на одной машине пару раз в день, то вам следует выбрать что-то, что потребует меньше усилий при написании кода, усилий и обслуживания. Является ли это ruby - это другой вопрос (я бы выбрал Groovy вместо Ruby для этой задачи => лучшая многопоточность + очень удобный синтаксический анализ XML). С другой стороны, если вы очищаете терабайты данных в день, то пропускная способность вашего приложения, вероятно, важнее, чем более короткое время разработки.
Кстати, любой, кто говорит, что вы бы никогда не захотели использовать какую-то технологию в каком-то контексте или, скорее всего, ошибался.