По умолчанию задачи карты hadoop записывают обработанные записи в файлы во временном каталоге в ${mapred.output.dir}/_temporary/_${taskid}
.Эти файлы находятся здесь до тех пор, пока FileCommiter не переместит их в ${mapred.output.dir}
(после успешного завершения задачи).У меня есть случай, когда в setup()
задачи карты мне нужно создать файлы в указанном выше временном каталоге, где я записываю некоторые относящиеся к процессу данные, которые позже используются в другом месте.Однако когда задачи hadoop убиты, временный каталог удаляется из HDFS.
Кто-нибудь знает, можно ли сказать Hadoop, чтобы он не удалял этот каталог после завершения задачи, и как этого добиться?Я предполагаю, что должно быть предоставлено какое-то свойство, которое я могу настроить.
С уважением