Как отфильтровать недействительные xmls - PullRequest
0 голосов
/ 02 марта 2019

Мне нужно обработать несколько xml, пример xml ниже

<?xml version="1.0"?>
  <Root>
    <Row>
      <info>            
         <name>Mich</name>          
         <id>123</id>       
      </info>       
      <detail>          
        <type>ind</type>        
     </detail>
 </Row>
 ......

Иногда структура xml может быть, обратите внимание, что в приведенном ниже xml

* есть только одна строка1007 *

После считывания данных в spark df я хочу отфильтровать все строки с типом как недействительные.Проблема заключается в том, что при наличии XML-файла только с одним элементом Row схема фрейма данных выводится как Struct, тогда как если в XML имеется несколько элементов Row, то он выводится как Array of Struct. Как справиться с этим ???

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...