Итак, я пытался использовать NLTK из Python для выполнения части тегов речи в текстовом файле.
Это код, который я использовал
import nltk
from nltk import word_tokenize, pos_tag
f = open('all.txt')
raw = f.read()
text = word_tokenize(raw)
paosted = nltk.pos_tag(text)
saveFile = open('ol.txt', 'w')
saveFile.write(str(paosted))
saveFile.close()
Код работал, но проблема в том, что он сохранил весь текст в одну строку, как показано на прилагаемом рисунке. как показано здесь .. Я знаю, что должен использовать функцию "\ n", но я новичок в Python и не знаю, как это сделать, поэтому любая помощь будет принята :) :)
-------- UPDATE -----------
ХОРОШО, Люди действительно помогли и предложили некоторые решения, то есть этот код:
import nltk
from nltk import word_tokenize, pos_tag
f = open('all.txt')
raw = f.read()
text = word_tokenize(raw)
paosted = nltk.pos_tag(text)
saveFile.write(str(paosted).replace('),' , '),\n'))
saveFile.close()
Но мне все еще нужно иметь его в форме абзаца, потому что я собираюсь использовать его в программном обеспечении согласования. Пожалуйста, посмотрите на этот скриншот:
https://i.stack.imgur.com/tU1NW.png