У меня был очень разреженный фрейм данных в pyspark, я конвертировал этот фрейм данных в CoordinatedMatrix.Теперь я хочу сохранить эту матрицу в формате hdf, чтобы позже использовать ее для обучения моей модели.К сожалению, я не нашел никакого решения для этого.Любой совет?
пример:
>> mat.entries.collect()
[MatrixEntry(1, 0, 1.0), MatrixEntry(1, 1, 1.0), MatrixEntry(1, 2, 2.0),MatrixEntry(1, 3, 1.0), MatrixEntry(2, 0, 2.0), MatrixEntry(2, 1, 1.0), MatrixEntry(2, 2, 3.0), MatrixEntry(2, 3, 5.0)]