У меня есть приведенная ниже программа, в которой я пытаюсь преобразовать текстовые файлы в символьную униграмму (вектор признаков) и записываю выходные данные в текстовый файл.
Я печатаю выходные данные на консоли и записываю ихв текстовый файл одновременно, однако, печать на консоль будет печатать все записи, в то время как печать в файл печатает только последнюю итерацию имени файла в статьях.
Должен ли я использовать массив для rawcu?
Мой код:
for fileName in allarticles:
rawcu = [0.0]*95
out=open("CASIS-25fvs_rawcu.txt","w")
fileOpen = open(fileName)
charFrequency = {}
for line in fileOpen:
for letter in line:
if((ord(letter) > 31) and ord(letter) < 127):
rawcu[ord(letter)-32] += 1.0
print rawcu
print >> out, rawcu