Я ищу утилиту python, которая позволяет динамически создавать фиктивный файл в HDFS, не затрагивая локальную файловую систему.
Эксперты, у меня есть простое требование, когда мне нужно создать фиктивный (0 байт) файл в HDFS в коде Pyspark. В основном я проверяю, существует ли файл x.lock (0 байт) в HDFS, и если это так, это означает, что мне нужно дождаться завершения другого процесса (который его создал) и удалить его. Если его не существует, моя работа создаст его и продолжит выполнение, а в конце удалит.