Я хотел бы посчитать конкретные слова в каждом файле моего корпуса ... вот мой код ... он работает нормально.
num= nltk.FreqDist(
(target,fileid)
for fileid in reader.fileids()
for w in reader.words(fileid)
for target in ['have'])
, но результаты такие: FreqDist: '2009.txt': 141205, '20 .txt': 43201, '2.txt': 41232, '4.txt': 40859, '5.txt': 40805, .....
Я бы хотелчтобы увидеть все значения по одному подряд.как ..
'2009.txt' 141205
'20 .txt '43201
Я пробовал этот код дополнительно
for results in num:
print results
Но он показываеттолько 'have', '' 200.txt '... номер FreqDist не отображается.
Кроме того, я попытался также nltk.ConditionalFreqDist () .. Это занимает FOREVER ..
Iне знаю почему .. Пожалуйста, помогите мне.Я потратил почти 4-5 часов на решение этой проблемы.
Заранее спасибо.