Ваш vectorizer.vocabulary_
имеет счетчик для каждого слова:
print(vectorizer.volcabulary_)
{'this': 8,
'is': 3,
'the': 6,
'first': 2,
'document': 1,
'second': 5,
'and': 0,
'third': 7,
'one': 4}
Расчет частоты слова является простым, тогда:
vocab = vectorizer.vocabulary_
tot = sum(vocab.values())
frequency = {vocab[w]/tot for w in vocab.keys()}