Я только начинаю на python и nltk и пытаюсь прочитать записи из файла csv и определить частоту конкретных слов во всех записях.Я могу сделать что-то вроде этого:
with f:
reader = csv.reader(f)
# Skip the header
next(reader)
for row in reader:
note = row[4]
tokens = [t for t in note.split()]
# Calculate row frequency distribution
freq = nltk.FreqDist(tokens)
for key,val in freq.items():
print (str(key) + ':' + str(val))
# Plot the results
freq.plot(20, cumulative=False)
Я не уверен, как изменить это так, чтобы частота встречалась во всех записях и чтобы были включены только слова, которые меня интересуют.Извиняюсь, если это действительно простой вопрос.