Привет все
Я новичок в питоне и программировании. Мне нужно читать кусками большого текстового файла, формат выглядит следующим образом:
<word id="8" form="hibernis" lemma="hibernus1" postag="n-p---nb-" head-"7" relation="ADV"/>
Мне нужна информация form
, lemma
и postag
. например для вышеупомянутых мне нужно hibernis
, hibernus1
и n-p---nb-
.
Как мне сказать python читать, пока он не достигнет формы, прочитать вперед, пока он не достигнет кавычки "
, а затем прочитать информацию между кавычками "hibernis"
? Действительно борется с этим.
До сих пор я пытался убрать пунктуацию, разбить предложение и затем извлечь нужную информацию из списка. Хотя у меня проблемы с получением Python для перебора всего файла, я могу заставить это работать только для 1 строки. Мой код ниже:
f=open('blank.txt','r')
quotes=f.read()
noquotes=quotes.replace('"','')
f.close()
rf=open('blank.txt','w')
rf.write(noquotes)
rf.close()
f=open('blank.txt','r')
finished = False
postag=[]
while not finished:
line=f.readline()
words=line.split()
postag.append(words[4])
postag.append(words[6])
postag.append(words[8])
finished=True
Буду признателен за любые отзывы / критику
спасибо