Каждый пользователь HDFS имеет собственную папку .Trash
на HDFS в пределах hdfs:///user/<name>
.Наличие папки проверяется, а затем создается всякий раз, когда этим пользователем выполняется команда hadoop fs -rm
без опции -skipTrash
.
Это очищается по расписанию согласно значениям core-site.xml
- fs.trash.interval
- fs.trash.checkpoint.interval
По умолчанию оба равны нулю, поэтому он отключен, и поэтому удаленные файлы всегда можно будет восстановить до тех пор, пока администратор HDFS не очистит их вручную.
Также см. Этот пост IBM по HDFS Trash