Попытка поиска по всему корпусу и распечатка частоты каждого слова, чтобы позже вычислить взаимную информацию каждого из них. Я получаю следующую ошибку. Может кто-нибудь объяснить, почему и простое решение этой проблемы?
Это то, что я пытался. Поиск в корпусе с индексной переменной, проверка. С каждым индексом он найдет свою соответствующую частоту. Позже я хочу вычислить оценку MI.
for check in corpus:
corpusUpdate = str(corpus)
word = word_tokenize(corpusUpdate)
dtm.get_token_occurences(word[check]) ---getting an error on this line!
docs = list(dtm.get_token_occurences(word[check]).keys())
Получено сообщение об ошибке:
TypeError: индексы списка должны быть целыми или кусочками, а несписок