Сортировка узлов после использования getElementsByTagName по атрибутам узлов - PullRequest
3 голосов
/ 21 апреля 2011

РЕДАКТИРОВАТЬ

Словарь является нарушителем здесь, ответ, отмеченный на этот вопрос, работает, словарь делает то, что хочет.Сортировка словаря - это ответ в этом случае, но теперь я знаю, как сортировать узлы по атрибутам, и вы тоже.

END

Я так рад бытьзадавая вопросы по Python, вот что у меня есть:

def parse_fixed_data(self, format):
    return_message = {}
    nodes = format.getElementsByTagName('data')
    for node in nodes:
        return_message[node.attributes['name'].value] = self.raw_message[int(node.attributes['from'].value):int(node.attributes['to'].value)] 
    return return_message

Это работает почти прекрасно.Переменная 'format' - это уже проанализированный узел, который содержит набор узлов 'data'.Вот xml:

<pmbmsg id='pmb_header'>
    <version maj='01' min='00' rev='0000' type='FIXED' delimeter=''>
        <data seq='1'   from='0'   to='3'    name='message_type'/>
        <data seq='2'   from='3'   to='13'   name='version'/>
        <data seq='3'   from='13'  to='33'   name='from_system'/>
        <data seq='4'   from='33'  to='53'   name='to_system'/>
        <data seq='5'   from='53'  to='73'   name='family'/>
        <data seq='6'   from='73'  to='83'   name='priority'/>
        <data seq='7'   from='83'  to='103'  name='msg_format_id'/>
        <data seq='8'   from='103' to='135'  name='msg_unique_id'/>
        <data seq='9'   from='135' to='161'  name='created'/>
        <data seq='10'  from='161' to='163'  name='hop_count'/>
        <data seq='11'  from='163' to='173'  name='original_msg_format_id'/>
        <data seq='12'  from='173' to='205'  name='original_unique_id'/>
        <data seq='13'  from='205' to='245'  name='padding'/>
        <data seq='14'  from='245' to='4086' name='message_data'/>
    </version>
</pmbmsg>

Ну, это все работает хорошо, но я возвращаю элементы словаря в следующем порядке:

u'to_system'            
u'padding'          
u'original_msg_format_id'   
u'original_unique_id'       
u'family'           
u'created'          
u'msg_format_id'        
u'hop_count'            
u'msg_unique_id'            
u'priority'         
u'version'          
u'from_system'          
u'message_type'         
u'message_data'

(значения удалены)

Я бы хотел, чтобы они вернулись в том порядке, в котором они указаны в xml, и атрибут seq может помочь в этом.После этой строки в коде Python:

nodes = format.getElementsByTagName('data')

... есть ли какая-нибудь функция, которую я мог бы запустить на узлах, которые бы сортировали это?Или есть что-то, что я мог бы заявить, получая узлы, которые позволили бы ему сортировать их?Вы могли бы подумать, что он просто получит его в порядке написания XML?

Если у меня нет функции сделать это автоматически, я могу справиться со взломом.

Ответы [ 2 ]

2 голосов
/ 21 апреля 2011

Узлы не сортируются по имени в XML, что также отражается в списке узлов.Они будут появляться в том же порядке, в котором они были повторены.Списки по определению упорядочены.Словари нет.Проблема, с которой вы сталкиваетесь, заключается в том, что когда вы выполняете итерацию ключей словаря, имена ваших атрибутов не в порядке, и нет никакой возможности обойти эту сортировку.

Вы можете либо отсортировать узлы до того, какобработка dict (которая все еще не гарантирует, что сам dict будет упорядочен):

>>> [node.attributes['name'].value for node in sorted(nodes, key=lambda x: x.attributes['name'].value)]
[u'created', u'family', u'from_system', u'hop_count', 
u'message_data', u'message_type', u'msg_format_id', u'msg_unique_id', 
u'original_msg_format_id', u'original_unique_id', u'padding', u'priority', 
u'to_system', u'version']

Или вы можете использовать collection.OrderedDict (доступно в Python 2.7+) вместообычный словарь для создания return_message.

# No example because I don't have acces to Python 2.7

Или вы можете отсортировать словарь по значениям, используя sorted().

>>> import operator
>>> sorted_return_message = sorted(return_message.iteritems(), key=operator.itemgetter(0))
>>> for k,v in sorted_return_message: print k
... 
created
family
from_system
hop_count
message_data
message_type
msg_format_id
msg_unique_id
original_msg_format_id
original_unique_id
padding
priority
to_system
version

Или вы можете просто отсортироватьключи во время выполнения:

>>> for k in sorted(return_message):
...     print k
... 
created
family
from_system
hop_count
message_data
message_type
msg_format_id
msg_unique_id
original_msg_format_id
original_unique_id
padding
priority
to_system
version
0 голосов
/ 21 апреля 2011

Начиная с Python 2.7, OrderedDict - это новая функция

...