Я пытаюсь сохранить файл json в HDFS, используя pyarrow.Вот как выглядит мой код.
from pyarrow import hdfs
fs = hdfs.connect(driver='libhdfs')
with fs.open(outputFileVal1, 'wb') as fp:
json.dump(list(value1set), fp)
Это выдает ошибку, говорящую TypeError: a bytes-like object is required, not 'str'
Когда я вместо этого пытаюсь использовать joblib.dump или pickle.dump, он работает, но не сохраняется в формате json.Есть ли способ сохранить файл json напрямую в hdfs, используя pyarrow.