У меня есть файл со многими json документами, с одним из столбцов документа xml. Например:
{"id":123abc,"userId":"12345","xmldoc":"<XML><Date Depart=\"2019-06-30\" Arrive=\"2019-06-22\" /><Passengers><Passenger Age=\"ADT\" Quantity=\"1\" /><Passenger Age=\"CHD\" Quantity=\"1\" /></Passengers><Destination Code=\"LAX\"/></XML>"}
Ниже приведен результат, который я ищу:
+----------+----------+----------+----------+-----------+----+---------+
| id| userId | Arrive| Depart|Destination|_Age|_Quantity|
+----------+----------+----------+----------+-----------+----+---------+
|123abc |12345 |2019-06-22|2019-06-30| LAX| ADT| 1|
|123abc |12345 |2019-06-22|2019-06-30| LAX| CHD| 1|
+----------+----------+----------+----------+-----------+----+---------+
Однако на этом этапе я могу извлечь только столбцы json с кодом ниже:
REFERENCE ASSEMBLY Test.[Newtonsoft.Json];
REFERENCE ASSEMBLY Test.[Microsoft.Analytics.Samples.Formats];
@trial2 =
EXTRACT jsonString string FROM @"/RawData/file.json" USING Extractors.Tsv(quoting:false, silent:true);
@jsonify = SELECT Microsoft.Analytics.Samples.Formats.Json.JsonFunctions.JsonTuple(jsonString) AS rec FROM @trial2;
@columnized = SELECT
rec["id"] AS ts,
rec["userId"] AS userId
FROM @jsonify;
OUTPUT @columnized
TO @"/out.csv"
USING Outputters.Csv();
Как мне также извлечь данные XML согласно желаемому результату ??