У меня большой текстовый файл, который я хотел бы превратить в список слов.Мне удалось получить список для каждой строки в файле, но я хочу один список.
Вот что у меня есть.
import unicodedata
import codecs
infile = codecs.open('FILE.txt', 'r', encoding ='ascii', errors = 'ignore')
outfile = codecs.open('FILE2.txt', 'w', encoding ='ascii', errors = 'ignore')
for word in infile:
mylist = str(word.split())
outfile.write(mylist)
infile.close()
outfile.close()
Это дает мне файл, который выглядит следующим образом:
[word, word][word, word, word, word][word, word]...[word,word]
Я надеюсь получить файл, который выглядит так:
[word, word, word, .... word, word, word]
Я знаю, какобъединить несколько списков, но эти списки немедленно записываются в мой файл.Как написано, мой код не позволил бы мне объединить списки после факта.
ОБНОВЛЕНИЕ:
Спасибо за вашу помощь.Я решил проблему со следующим:
import unicodedata
import codecs
infile = codecs.open('FILE1.txt', 'r', encoding ='ascii', errors = 'ignore')
outfile = codecs.open('FILE2.txt', 'w', encoding ='ascii', errors = 'ignore')
mylist =[]
for line in infile:
for word in line.split():
mylist.append(word)
outfile.write(str(mylist))
infile.close()
outfile.close()