Как найти слово в XML-файле и распечатать его на Python - PullRequest
0 голосов
/ 20 октября 2018

Я хочу найти определенное слово (которое вводится пользователем) в файле .xml.Это мой xml-файл.

<?xml version="1.0" encoding="UTF-8"?>
<words>
<entry>
<word>John</word>
<pron>()</pron>
<gram>[Noun]</gram>
<poem></poem>
<meanings>
<meaning>name</meaning>
</meanings>
</entry>
</words>

вот мой код

import nltk
from nltk.tokenize import word_tokenize
import os
import xml.etree.ElementTree as etree


sen = input("Enter Your sentence - ")

print(sen)
print("\n")
print(word_tokenize(sen)[0])

tree = etree.parse('roman.xml')
node=etree.fromstring(tree)

#node=etree.fromstring('<a><word>waya</word><gram>[Noun]</gram> 
<meaning>talking</meaning></a>')
s = node.findtext(word_tokenize(sen)[0])
print(s)

Я пробовал все, но все равно выдает ошибку

байт-как объект требуется, а не 'ElementTree'

Я действительно не знаю, как его решить.

1 Ответ

0 голосов
/ 20 октября 2018

ошибка возникает из-за того, что вы передаете объект elementtree в методы fromstring ().Сделайте так:

>>> import os
>>> import xml.etree.ElementTree as etree
>>> a = etree.parse('a.xml')
>>> a
<xml.etree.ElementTree.ElementTree object at 0x10fcabeb8>
>>> b = a.getroot()
>>> b
<Element 'words' at 0x10fb21f48>
>>> b[0][0].text
'John'

Используйте для поиска методы find () и findall ().

для получения дополнительной информации, проверьте lib: https://docs.python.org/3/library/xml.etree.elementtree.html

Простой пример:

test.xml

<?xml version="1.0" encoding="UTF-8"?>
<words>
  <word value="John"></word>
  <word value="Mike"></word>
  <word value="Scott"></word>
</words>

example.py

root = ET.parse("test.xml")
>>> search = root.findall(".//word/.[@value='John']")
>>> search
[<Element 'word' at 0x10be9c868>]
>>> search[0].attrib
{'value': 'John'}
>>> search[0].tag
'word'
...