Как получить сумму любого данного столбца в матрице частот термина, возвращенной sklearn CountVectorizer
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
vectorizer = CountVectorizer()
corpus = [ 'This is a sentence',
'Another sentence is here',
'Wait for another sentence',
'The sentence is coming',
'The sentence has come'
]
x = vectorizer.fit_transform(corpus)
Теперь я хочу узнать частоту sentence
в матрице.Поэтому я хочу сумму столбца sentence
.Я не мог найти способ сделать это.Любая помощь высоко ценится.Например, я попытался x['sentence'].sum()
, но это не помогло
Я также попытался преобразовать это в фрейм данных pandas и вычислить сумму, но я не хочу конвертировать эту матрицу в фрейм данных.