Я получаю набор данных json из внешнего источника, поэтому не могу повлиять на формат. Значения данных форматируются в квадратных скобках и двойных кавычках. Например, [{"casenumber": ["12345678"], "problemcode": ["ABC123"], "TITLE": ["Ты что, шутишь?"]}]
Я могу прочитать / проанализировать это в DataFrame, но когда я пытаюсь записать DataFrame в Excel, все данные помечаются квадратными скобками и одинарными кавычками. Есть ли способ удалить все теги, чтобы мне не нужно было вручную очищать данные Excel?
Я пробовал несколько вариантов пост-обработки данных после чтения их из JSON, но не могу заставить их работать
import json,
def getJSONData(file):
returnFrame = pd.DataFrame()
with open(file, 'r', encoding="utf8") as jsonfile:
json_data=jsonfile.read()
loaded_json = json.loads(json_data)
returnFrame=returnFrame.append(loaded_json)
#strip out tags
for label, content in returnFrame.iteritems():
returnFrame[label]=content.replace("[","")
return returnFrame
.
.
.
caseDataFrame=getJSONData(JSONFolderFileName)
caseDataFrame.to_excel('CaseData'+str(time.time())+'.xlsx')
В Excel данные выглядят так (представьте, что «|» - это граница ячейки):
регистрационный номер | код проблемы | TITLE
['12345678'] | ['ABC123'] | [«Ты что, шутишь?»]
и я бы предпочел, чтобы это выглядело так:
регистрационный номер | код проблемы | TITLE
12345678 | ABC123 | Ты что, шутишь?