У меня есть 2 списка частот с тысячами элементов, в то время как у меня также есть 2 небольших списка с несколькими элементами.Идея состоит в том, что мне нужно проверить, сколько раз каждый элемент моего меньшего списка появляется в списках частот, и сравнить их, и, наконец, отобразить мои выводы в таблице, используя пакет pandas.
Списки частот:
pos_freqdist = FreqDist(get_all_words(pos_train))
neg_freqdist = FreqDist(get_all_words(neg_train))
Это то, что pos_freqdist печатает как есть (он не просто печатает все положительные слова, но подсчитывает частотуслова, которые содержатся в положительных рецензиях):
FreqDist({'the': 6737, '.': 6513, ',': 6357, 'and': 3952, 'a': 3441, 'of': 3268, 'to': 2980, 'is': 2645, 'I': 2068, 'in': 1956, ...})
И у меня также есть два небольших списка, в которых мало слов сентиментальности:
my_positive_word_list
my_negative_word_list
Я проверяю положительные / отрицательные настроенияиз этих слов в тысячах обзоров, которые я уже классифицировал как положительные и отрицательные.
Действительно ли список частот действительно считается словарем?Кортеж?Я не уверен.