Я работаю над кластером с набором данных, состоящим из файлов аудио .wav. Мне нужно открыть эти файлы аудио, чтобы проанализировать их, но проблема в том, что эти файлы находятся в hdfs, и если я передаю путь к файлам в hdfs в wave.open (), это дает мне следующую ошибку:
Traceback (most recent call last):
File "/home/user24/LSCproject/Main.py", line 41, in <module>
wav = WAV(spark_session)
File "/home/user24/LSCproject/wav_manipulation/wav.py", line 23, in __init__
self.wav = wave.open('hdfs://master:9000/user/user24/Database/audio_and_txt_files/107_2b3_Al_mc_AKGC417L.wav', mode='r')
File "/usr/lib/python2.7/wave.py", line 511, in open
return Wave_read(f)
File "/usr/lib/python2.7/wave.py", line 160, in __init__
f = __builtin__.open(f, 'rb')
IOError: [Errno 2] No such file or directory: 'hdfs://master:9000/user/user24/Database/audio_and_txt_files/107_2b3_Al_mc_AKGC417L.wav'
Есть ли способ открыть эти файлы с помощью pyspark или другой способ открыть его?
Любые указания или рекомендации приветствуются!