Сравнение слов в списке со словами в списке частот с помощью панд - PullRequest
0 голосов
/ 26 ноября 2018

У меня есть 2 списка частот с тысячами элементов, в то время как у меня также есть 2 небольших списка с несколькими элементами.Идея состоит в том, что мне нужно проверить, сколько раз каждый элемент моего меньшего списка появляется в списках частот, и сравнить их, и, наконец, отобразить мои выводы в таблице, используя пакет pandas.

Списки частот:

pos_freqdist = FreqDist(get_all_words(pos_train))
neg_freqdist = FreqDist(get_all_words(neg_train))

Это то, что pos_freqdist печатает как есть (он не просто печатает все положительные слова, но подсчитывает частотуслова, которые содержатся в положительных рецензиях):

FreqDist({'the': 6737, '.': 6513, ',': 6357, 'and': 3952, 'a': 3441, 'of': 3268, 'to': 2980, 'is': 2645, 'I': 2068, 'in': 1956, ...})

И у меня также есть два небольших списка, в которых мало слов сентиментальности:

my_positive_word_list
my_negative_word_list

Я проверяю положительные / отрицательные настроенияиз этих слов в тысячах обзоров, которые я уже классифицировал как положительные и отрицательные.

Действительно ли список частот действительно считается словарем?Кортеж?Я не уверен.

1 Ответ

0 голосов
/ 26 ноября 2018

Вы можете получить доступ к списку частот, как обычный словарь.Внутренне он имеет словарную структуру для более быстрого доступа, поэтому вы можете сделать pos_freqdist['the'] и он печатает 6737

...