снежинка: не может рекурсивно разобрать xml - PullRequest
0 голосов
/ 27 апреля 2020

У меня есть это xml

<product product-id="P001">
  <images>
    <image-group view-type="vt01">
      <image path="IP001">
        <title xml:lang="default"></title>
      </image>
      <image path="IP002">
        <title xml:lang="JP"></title>
      </image>
      <image path="IP003">
        <title xml:lang="KOR"></title>
      </image>
      <image path="IP004">
        <title xml:lang="ENG"></title>
      </image>
      <image path="IP005">
        <title xml:lang="RUS"></title>
      </image>
      <image path="IP006">
        <title xml:lang="FRA"></title>
      </image>
    </image-group>
  </images>
</product>

Мне нужно получить все отдельные изображения детали для каждой группы изображений в списке

image group : vt01
  image path : IP001 
  image lang : default

  image path : IP002 
  image lang : JP

  image path : IP003 
  image lang : KOR

  image path : IP004 
  image lang : ENG

  image path : IP005 
  image lang : RUS

  image path : IP006
  image lang : FRA

Теперь я получаю ТОЛЬКО ПЕРВЫЙ уровень image-group деталь и ПЕРВЫЙ уровень image деталь.

image group : vt01
  image path : IP001      
  image lang : default

Я загрузил XML SNOWFLAKE, используя «copyinto», используя этот код:

WITH SRC AS (SELECT PARSE_XML(CAT_XML) as XML FROM "SAMPLE"."XML_02")
select
t.value:"@view-type" as VIEW_TYPE,
xmlget(t.value,'image'):"@path" as IMAGE_PATH,
xmlget(xmlget(t.value,'image'), 'title'):"@xml:lang" as TITLE_LANG
from SRC s,
table(flatten(input => to_array(xmlget(s.XML,'images'):"$"),recursive=> FALSE)) t

Может кто-нибудь помочь мне с этим

1 Ответ

0 голосов
/ 27 апреля 2020

Разбор иерархической структуры XML может быть похож на развязывание Гордиева узла. Вы можете вкладывать предложения get, xmlget, боковые и flatten, но это становится нечитаемым и трудно поддерживаемым. Мой рекомендуемый подход состоит в том, чтобы делать это шаг за шагом, используя CTE.

Вы можете протестировать следующий CTE. Предполагается, что ваш XML находится в таблице с именем 'SR C' в столбце с именем 'XML', определенном как вариант типа. Оттуда вы можете изменить при необходимости для работы с вашим оператором копирования.

with 
IMAGES("VALUE") as
(
    select "VALUE" from SRC, lateral flatten(SRC.XML:"$") IMAGES where "KEY" = '$'
),
IMAGE_ARRAY(IMAGE) as
(
    select I."VALUE" from IMAGES, lateral flatten(IMAGES."VALUE") I where "KEY" = '$'
),
IMAGE(IMAGE_XML) as
(
    select "VALUE" from IMAGE_ARRAY, lateral flatten(input => to_array(IMAGE)) IMG
)    
select get(IMAGE_XML, '@path')::string as PATH,
       get(get(IMAGE_XML, '$'), '@xml:lang')::string  as LANG
from   IMAGE
;
...