Одним из способов является использование ключа -filter команды mergedb.Команда принимает в качестве входных данных базу данных обхода и создала новую базу данных обхода с некоторыми фильтрованными URL-адресами.Просто используйте эту отфильтрованную базу данных обхода для индексации.
Единственным недостатком этого является то, что я не нашел способа для команды mergedb использовать другой файл, кроме regex-urlfilter.txt, который используется файломгенератор.Вам нужно будет сохранить два файла, например regex-urlfilter.txt: один используется для генератора с abc.com , а другой - для команды mergedb, которая исключает URL-адреса, отличные от car.abc.com.Но поскольку обе команды пытаются загрузить один и тот же файл, вам придется переименовать соответствующий файл в regex-urlfilter.txt, прежде чем вызывать одну из двух команд.
Если кто-то знает способ настроить команду mergedb наиспользуйте другой файл, я буду рад это услышать!