Открыть .WAV файл из hdfs - PullRequest
0 голосов
/ 03 мая 2020

Я работаю над кластером с набором данных, состоящим из файлов аудио .wav. Мне нужно открыть эти файлы аудио, чтобы проанализировать их, но проблема в том, что эти файлы находятся в hdfs, и если я передаю путь к файлам в hdfs в wave.open (), это дает мне следующую ошибку:

Traceback (most recent call last):
  File "/home/user24/LSCproject/Main.py", line 41, in <module>
    wav = WAV(spark_session)
  File "/home/user24/LSCproject/wav_manipulation/wav.py", line 23, in __init__
    self.wav = wave.open('hdfs://master:9000/user/user24/Database/audio_and_txt_files/107_2b3_Al_mc_AKGC417L.wav', mode='r')
  File "/usr/lib/python2.7/wave.py", line 511, in open
    return Wave_read(f)
  File "/usr/lib/python2.7/wave.py", line 160, in __init__
    f = __builtin__.open(f, 'rb')
IOError: [Errno 2] No such file or directory: 'hdfs://master:9000/user/user24/Database/audio_and_txt_files/107_2b3_Al_mc_AKGC417L.wav'

Есть ли способ открыть эти файлы с помощью pyspark или другой способ открыть его?

Любые указания или рекомендации приветствуются!

...