Я пытаюсь создать разреженную матрицу для классификации текста, используя пакет слов, но проблема в том, что мой код создает нграммы на основе самого текста.У меня есть собственный список ngram, для которого я хочу создать разреженную матрицу.Как мне сделать это в Python?Ниже приведен код, который я сам создаю разреженной матрицей, используя ngram:
vectorizer = CountVectorizer(
analyzer = 'word',
lowercase = True,
stop_words = 'english',
max_features = 85
)
corpus_data_features = vectorizer.fit_transform(train_data.Query.tolist())