Я новичок в Python. Теперь его Python 2.7
Я обрабатываю xml в elementTree и использую Mongodb.
XML, который я собираюсь обработать, это "http://www.sec.gov/Archives/edgar/usgaap.rss.xml"
ниже приведен код для этого:
import os
import cgi
import sqlite3 as litefire
import sys
sys.stderr = sys.stdout
from xml.etree import ElementTree
from pymongo import Connection
connc2=Connection('localhost',27017)
db2=connc2['rss']
rss=db2.rss
xmlrss=[]
treexsdr = ElementTree.parse('xbrlrss_all.xml')
i=0
k=0
o=0
o2=0
iter = treexsdr.getiterator()
for element in iter:
if element.tag:
o=i+k
xmlname=element.tag
if element.keys():
attributedict = dict(element.items())
for name, value in element.items():
krishna=element.items()
if element.text:
text = element.text
xmlnamelist={"xmlname":xmlname,"text":text,"ownid":o,"parentid":o2,"xmlattkeys":{k:v for k,v in krishna}}
xmlrss.append(xmlnamelist)
if element.getchildren():
o2=o
for child in element:
k=k+1
i=i+1
rss.insert(xmlrss)
Сообщение об ошибке, которое я получил в IDE, как показано ниже, при применении krishna = dict (element.items ()):
Message File Name Line Position
Traceback
<module> D:\test\mongo_rss.py 44
insert C:\Python27\lib\site-packages\pymongo\collection.py 312
InvalidDocument: key '{http://www.sec.gov/Archives/edgar}file' must not contain '.'
Если krishna = element.items (), то в mongodb я получаю:
{
"_id" : ObjectId("4f69bb6e17ea930fd803a958"),
"text" : "en-us",
"xmlname" : "language",
"xmlattkeys" : [["href", "http://www.sec.gov/Archives/edgar/xbrlrss.all.xml"], ["type", "application/rss+xml"], ["rel", "self"]],
"parentid" : 2,
"ownid" : 16
}
Но я хочу
{
"_id" : ObjectId("4f69bb6e17ea930fd803a958"),
"text" : "en-us",
"xmlname" : "language",
"xmlattkeys" : {"href":"http://www.sec.gov/Archives/edgar/xbrlrss.all.xml", "type":"application/rss+xml", "rel":"self"},
"parentid" : 2,
"ownid" : 16
}
Пожалуйста, помогите мне в этом.