Я ищу синтаксический анализатор robots.txt в Java, который поддерживает те же правила сопоставления с шаблоном , что и робот Google.
Я нашел несколько библиотек для разбора robots.txtфайлы, но ни один из них не поддерживает сопоставление с шаблоном в стиле Googlebot:
- Heritrix (существует открытый выпуск на эту тему)
- Crawler4j (выглядит какта же реализация, что и у Heritrix)
- jrobotx
Кто-нибудь знает библиотеку Java, которая может это сделать?