Goose временно хранит данные в локальном хранилище, прежде чем сможет извлечь из него содержимое. Я не знаю ни одного сканера, который может делать это на ходу без использования некоторого объема локального хранилища,
Путь к локальному хранилищу можно настроить из файла configuration.py as self.local_storage_path =
.также в этом файле установите self.debug =False
, чтобы избежать дальнейшей загрузки.
также после того, как гусь закончил, используйте функцию release_resources()
, как предложено в комментариях, она выглядит следующим образом
def relase_resources(self):
path = os.path.join(self.config.local_storage_path, '%s_*' % self.article.link_hash)
for fname in glob.glob(path):
try:
os.remove(fname)
except OSError:
# TODO better log handling
pass
и очищает временные ресурсы.
Как правило, tmp-файлов даже из нескольких сотен источников среднего уровня должно быть недостаточно для сбоя системы.