У меня есть следующие данные в формате json
{"SrcFileName": "/Hadoop_SAN/TU_Prod/TMP/extract-YES-2019.08.18.json" , «Row_Number»: 32, «TransactionName»: «Renewal», «OrderCalculatedResult_PremiumInclIpt»: «0», «OrderPcSpecifiedCycle_Prn»: «1», «OrderPcSpecifiedCycle_AmtReqd»: «1», «OrderPc_yPyccified» «1», «OrderPcSpecifiedCycle_Prn»: «3», «OrderPcSpecifiedCycle_AmtReqd»: «1», «OrderPcSpecifiedCycle_Prn»: «4», «OrderPcSpecifiedCycle_AmtReqd»: «1», OrderPycyPyPyCyPC "," OrderPcSpecifiedCycle_Prn ":" 6 "," OrderPcSpecifiedCycle_AmtReqd ":" 1 "," OrderPcSpecifiedCycle_Prn ":" 7 "," OrderPcSpecifiedCycle_AmtReqd ":" 1 ", 1", OrderPc_yPyCypecified " "OrderPcSpecifiedCycle_Prn": "9", "OrderPcSpecifiedCycle_AmtReqd": "1", "OrderPcSpecifiedCycle_Prn": "10", "OrderPcSpecifiedCycle_AmtReqd": "1", "Qtimestamp": "2019-08-18T18: 20: 56.202Z"}
Я использую следующий запрос для преобразования его в таблицу
SELECT
SrcFileName
,Row_Number
,OrderPcSpecifiedCycle_Prn
,Jt.Json_field
FROM DP_SANDBOX.Order_Specified jt
LATERAL VIEW JSON_TUPLE(jt.Json_field, 'SrcFileName','Row_Number','OrderPcSpecifiedCycle_Prn')Q1 as SrcFileName,Row_Number,OrderPcSpecifiedCycle_Prn
Текущий набор результатов / строка:
srcfilename, row_number, orderpcspecifiedcycle_prn
/ Hadoop_SAN / TU_Prod / TMP / extract-YES-2019.08.18. json, 32, 10
Примечание. Возвращено только 1 строка и игнорирование других значений в OrderPcSpecifiedCycle_Prn, таких как 1,2,3,4,5,6,7,8,9
Вопрос: 1 Как я могу также получить эти значения? Вопрос: 2 Почему он возвращает только последнее значение в нем?