Как сканировать изображения в Nutch? - PullRequest
2 голосов
/ 14 июля 2010

Как сканировать изображения в Nutch?Или есть какой-нибудь другой открытый поисковик, который выдает результаты с изображениями?

1 Ответ

0 голосов
/ 10 сентября 2015

измени свой regex-urlfilter.txt в conf

- (ICO |. ICO | CSS | CSS | сидеть | SIT | EPS | EPS | WMF | WMF | застежка-молния | ZIP | РРТ | РРТ | XLS | XLS | GZ | GZ | мин | RPM | TGZ | TGZ | exe | EXE | js | JS | gif | GIF | png | PNG || jpg | JPG | jpeg | JPEG | bmp | BMP | mpg | MPG | mov | MOV) $

Удалить jpeg, jpg, gif или type изображение, которое вы хотите grep .

А затем изменить suffix-urlfilter.txt в conf

добавить # к jpeg, gif или png

Это сработало для меня!

...