Я пытаюсь создать программу python, которая проходит через CSV-файл, который выбирает пользователь, и печатает общее количество предложений на основе полной остановки или новой строки, а также общее количество всех слов.
вставить файл
общее количество предложений: 3
общее количество слов: 15
общее количество слов без повторения: 12
data = pd.read_csv('dundun.csv', sep='\t')
words = data['sentences'].str.split(expand=True)
word_count = {}
for word in words:
count = word_count.get(word, 0)
count += 1
word_count[word] = count
print(word_count)
Я пытаюсь этот код, но он дает неправильный вывод для подсчета слов, которые смотрит мой CSV как:
