У меня есть таблица кустов типа parquet со столбцом Content
, в которой хранятся различные документы в кодировке base64.
Теперь мне нужно прочитать этот столбец и записать в файл в HDFS, чтобы base64столбец будет преобразован обратно в документ для каждой строки.
val profileDF = sqlContext.read.parquet("/hdfspath/profiles/");
profileDF.registerTempTable("profiles")
val contentsDF = sqlContext.sql(" select unbase64(contents) as contents from profiles where file_name'file1'")
Теперь, когда contentDF
хранит двоичный формат документа в виде строки, которую мне нужно записать в файл.Пробовал разные варианты, но не мог вернуть содержимое фрейма данных в файл.
Оцените любую помощь по этому поводу.