Я новичок в Python.У меня есть текстовый файл , как показано ниже, с тысячами документов (от id = 1 до id = 10000):
<doc id=1>
<label>1</label>
<summary>
I think you are right
</summary>
<short_text>
I think you are right. Because I have once read the book in the same topic.
</short_text>
</doc>
Есть ли какой-нибудь удобный способ прочитать текстовый файл и сохранитьсодержание в инстансах?
class ShortText:
def __init__(self, my_id, human_label, summary, short_text):
self.id = my_id
self.human_label = human_label
self.summary = summary
self.short_text = short_text
def __str__(self):
'''
For printing purposes.
'''
return '%d\t%s\t%s\t%s' % (self.id, self.human_label, self.summary, self.short_text)
def load_file(filename):
#retrieve the original text
with codecs.open(filename, encoding='utf-8') as f:
data = f.read()
#how to get values from tags and put it below?
my_id =
human_label =
summary =
short_text =
instances[my_id] = ShortText(my_id, human_label, summary, short_text)
return instances