XML до даты Python - PullRequest
       7

XML до даты Python

0 голосов
/ 27 марта 2020

У меня проблема с анализом xml до Pandas DF в Python. Я не могу получить данные из файла XML.

Я хотел бы прочитать этот файл XML и преобразовать его в DF

NIP Name Sell ID contractor ID contractor Name contractor Adress Documents ID Date K_23 K_24

Пожалуйста помощь

<?xml version="1.0" encoding="utf-8"?>
<JPK xmlns="http://jpk.mf.gov.pl/wzor/2017/11/13/1113/" xmlns:etd="http://crd.gov.pl/xml/schematy/dziedzinowe/mf/2016/01/25/eD/DefinicjeTypy/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://jpk.mf.gov.pl/wzor/2017/11/13/1113/ https://www.gov.pl/documents/2034621/2182793/Schemat_JPK_VAT(3)_v1-1.xsd/ab0741d5-fa6d-9596-b089-6778ea5df160">
  <Head>
    <ID="zzzzzzz" versionSchemy="1-1">zzzzzz</ID>
    <Tarfet>1</Targer>
    <CreateDate>2020-01-21T09:51:58</CreateDate>
    <Datefrom>2019-11-01</Datefrom>
    <DateTo>2019-11-30</DateTo>
    <System>xxxxx</System>
  </Head>
  <Client>
    <NIP>xxxxxxxx</NIP>
    <Name>xxxxxx</Name>
  </Client>
  <Sell>
    <Sell ID>1</Sell ID>
    <contractor ID >xxxxxxx</contractor ID>
    <contractor Name>xxxxxxx"</contractor Name>
    <contractor Adress>xxxxxxxxx</contractor Adress>
    <Documents ID >xxxxxxxxxx</Documents ID >
    <Date>2019-11-01</Date>
    <K_23>31532513.17</K_23>
    <K_24>5324.05</K_24>
  </Sell>
  <Sell>
    <Sell ID>2</Sell ID>
    <contractor ID >yyyy</contractor ID>
    <contractor Name>yyyyy"</contractor Name>
    <contractor Adress>yyyyyyy</contractor Adress>
    <Documents ID >yyyyyyyyy</Documents ID >
    <Date>2019-11-05</Date>
    <K_23>312513.17</K_23>
    <K_24>5532.05</K_24>

1 Ответ

0 голосов
/ 27 марта 2020

Использовать xmltodict:

import xmltodict

with open(file_name, 'rb') as f:
     data = xmltodict.parse(f.read())

данные будут упорядоченными документами, и из них вы можете извлечь нужные данные.

...