Я пытаюсь проанализировать файл XML с помощью elementtree.Однако XML-файл, который я пытаюсь прочитать, был экспортирован из MySql, и при создании XML-файла, если у меня есть запись в базе данных, например: c: cygwin \ bin, он переводит «\ b» как возврат.В любом случае я пытаюсь удалить все записи '\ b' из файла XML, чтобы я мог отправить его через метод elementtree.parse ().И по какой-то причине после удаления всех записей '\ b' я не выписываю весь файл.
Вот что я делаю:
def preprocess(file):
#exporting from MySQL query browser adds a weird
#character to the result set, remove it
#so the XML parser can read the data
print "in preprocess"
lines = map(lambda line: line.replace("\b", " "), file)
#go to the beginning of the file
file.seek(0);
#overwrite with correct data
file.writelines(lines)
sys.exit()
'''Entry into the program'''
#test the file to see if processing is needed before parsing
for line in xml_file:
p = re.compile("\\b") #search for '\b'
if(p.match(line)):
processing = True
break #only one match needed
if processing:
preprocess(xml_file)
Результаты яв итоге получается файл XML с обрезанным заголовком, поэтому при передаче парсеру он не работает.
Вот что вырезано из XML-файла:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE ROOT SYSTEM "diskreport.dtd">
<ROOT>
<row>
<field name="buildid">26960</field>
<field name="cast(status as char)">Filesystem 1K-blocks Used Available Use% Mounted on
C:cygwinin 285217976 88055920 197162056 31% /usr/bin
Любая помощь / идеи были бы великолепны, спасибо