Вы правы, не используйте их, они слишком тяжелые.
Использование: Crawler4j
Следуйте инструкциям на месте для простого сканера.
Единственное, что вам нужно, - это изменение в MyCrawler.java: удаление «css» из шаблона FILTERS. В методе visit () поместите простое условие следующим образом:
if (url.contains(".css")) {
// do what you need with it
}
Вот и все -ты хороший!