Как и в предыдущем посте - знакомство имеет большое значение. Я также сказал бы, посмотрите, на что был изначально рассчитан язык - он дает хорошее представление о том, в чем он лучше всего.
PHP - разработан для сценариев на стороне сервера, не очень подходит для этого использования.
Perl - предназначен для разделения текста (хорошее начало) и отличных библиотек - посмотрите на LWP и модули в HTML, такие как HTML :: Treebuilder - хороший выбор. Непревзойденный выбор модулей для плагина.
Python - хороший выбор, посмотрите на Beautifulsoup и urllib
Ruby - также хороший выбор, посмотрите на hpricot, гораздо менее зрелый, чем Perl или Python, с точки зрения доступных модулей.
Я написал довольно много программного обеспечения для веб-пауков / интеллектуального анализа данных и всегда использовал Perl. Если бы я сегодня начинал с нуля, я мог бы выбрать python.