Если у вас есть ряд частот слов, где индекс серии - это сами слова, вы можете отфильтровать стоп-слова, используя одно выражение панд: words = words[words.index.values != stop_words.values]
.
Вот пример использования серии, которая похожа на образец, который вы вставили выше:
words = pd.Series(data = [89086, 85946, 1098], index = ['word1', 'word2', 'word500'])
word1 89086
word2 85946
word500 1098
dtype: int64
И затем, если у вас есть другой ряд, содержащий в качестве значений стоп-слова:
stop_words = pd.Series(data=['word2'])
0 word2
dtype: object
Чтобы отфильтровать ряд частот слов, чтобы исключить стоп-слова, вы должны выполнить следующую строку кода:
words = words[words.index.values != stop_words.values]
Который выводит ваш исходный ряд частот слов, но без удаленных слов:
word1 89086
word500 1098
dtype: int64