Все -
Я пытаюсь проанализировать следующую, очень простую структуру документа XML, используя
from xml.dom.minidom import parse
XML выглядит так:
<?xml version="1.0" encoding="utf-8"?>
<list>
<file name="..." url="...">
<words>
word_1
word_2
...
Проблема, с которой я столкнулся, состоит в том, что в XML содержится список слов, к которым я хотел бы получить доступ в виде списка строк ... и я просто не могу понять, что это правильно. Вот что у меня есть в плане кода:
import sys
from xml.dom.minidom import parse
for file in sys.argv[1:]:
dom = parse( file )
title = dom.getElementsByTagName( 'job_ad' )[0].getAttribute( 'title' )
# This works
words = dom.getElementsByTagName( 'unigrams' )[0].childNodes[0]
# This is NOT a list of strings ...
Я хотел бы перебрать структуру данных «слова» в этом коде. Я знаю, что доступны гораздо более мощные XML-модули ... но сейчас я бы хотел решить эту проблему с помощью показанного модуля.
Любая помощь с этим будет очень признательна.
Заранее спасибо и всего наилучшего -
Pat