Мне неизвестно о готовых скребках общего назначения, но вы можете найти их через Google.
Написание веб-скребка определенно выполнимо. В моем очень ограниченном опыте (я написал только пару), мне не нужно было иметь дело с проблемами входа в систему / безопасности, но в Googling вокруг я видел некоторые примеры, которые имели дело с ними - боюсь, я не помню URL для этих страниц , Мне нужно было знать некоторые особенности о страницах, которые я чистил; это облегчило написание скребка, но, конечно, скребки были ограничены для использования на этих страницах. Однако, если вы просто захватываете всю страницу, вам могут понадобиться только URL-адреса соответствующих страниц.
Не зная, какой язык (языки) будет приемлем для вас, трудно помочь намного больше. FWIW, я сделал скребки в PHP и Python. Как сказал Бен Г., у PHP есть cURL, чтобы помочь с этим; может быть, есть и другие, но я не очень хорошо знаю PHP. В Python есть несколько модулей, которые вы можете выбрать, включая lxml , BeautifulSoup и HTMLParser .
Редактировать: Если вы работаете в Unix / Linux (или, я полагаю, CygWin), вы можете достичь желаемого с помощью wget .