Я хотел бы извлечь определенные точки данных из загруженного файла xml (https://s3.amazonaws.com/irs-form-990/201542399349300614_public.xml).
import pandas as pd
import csv
import os
from os import path
from xml.dom import minidom
from xml.etree import ElementTree
import requests
from bs4 import BeautifulSoup
#from IRS_Download import *
import sys
for o in object_id:
file_name = "" + o + ".xml"
basepath = path.dirname(__file__)
filepath = path.abspath(path.join(basepath, file_name))
dom = minidom.parse(filepath)
EmIdN = dom.getElementsByTagName('EIN')
print(EmIdN)
Это, однако, возвращает только:
Элемент DOM: EIN в 0x1132eecc0
Любая идея, что я делаю неправильно ??