Очистка данных от Apache Nutch - PullRequest
       38

Очистка данных от Apache Nutch

0 голосов
/ 19 февраля 2020

Я только начинаю с Apache Натч, и я следую некоторым урокам, с которыми мне удалось справиться. Теперь я хотел бы удалить все данные, которые были собраны во время игры, есть ли способ легко удалить все загруженные данные из Nutch?

1 Ответ

1 голос
/ 19 февраля 2020

Чисто со стороны Nutch, удалив все сегменты (обычно в каталоге crawldb), вы вернетесь в чистое состояние. Если вы индексировали данные в Solr / ES / et c., Возможно, вы захотите (потенциально) также удалить все эти данные. Этот последний шаг может зависеть от того, какой механизм хранения вы используете.

...