Вероятно, вы могли бы попробовать TfIfdVectorizer вместо CountVectorizer
from sklearn.feature_extraction.text import TfidfVectorizer
vectorizer = TfidfVectorizer(min_df=5) # min_df Applies to minimum document frequency, not necessary
wordFrequency = vectorizer.fit_transform(corpus)
word = vectorizer.get_feature_names()
print(word)
По сути, просто измените используемый векторизатор. Ура!