Как преобразовать JSON-файл в CSV-файл, используя Python или спарк данных - PullRequest
0 голосов
/ 09 апреля 2019

Мне нужно конвертировать файл json в файл csv, используя спарк-фрейм данных в кирпичах данных.Я пробовал приведенный ниже код для преобразования JSON в CSV, но я получаю источник данных CSV не поддерживает тип данных массива в кадре данных искры.Я не могу преобразовать в CSV-файл. Может ли кто-нибудь помочь мне в этом вопросе, как удалить _corrupt_string?

 import json
    data=r'/dbfs/FileStore/tables/ABC.json'
    print ("This is json data ", data)
    def js_r(data):
       with open(data, encoding='utf-8') as f_in:
           return(json.load(f_in))

    if __name__ == "__main__":
        dic_data_first = js_r(data)
        print("This is my dictionary", dic_data_first)
    keys= dic_data_first.keys()
    print ("The original dict keys",keys)
    dic_data_second={'my_items':dic_data_first['Data']for key in keys}
    with open('/dbfs/FileStore/tables/ABC_1.json', 'w') as f:   
         json.dump(dic_data_first, f)
    df = sqlContext.read.json('dbfs:/FileStore/tables/ABC_1.json')   # reading a json and writing a  parquet
    print(df)
df.write.mode("overwrite").format("com.databricks.spark.csv").option("header","true").csv("/dbfs/FileStore/tables/ABC_1.csv")
JSON data as follows:
{"Table":"test1",
  "Data":[
{"aa":"1",
 "bb":"2"},
{"aa" :"ss",
"bb":"dc"}            
}]
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...