У меня есть DataFrame с 8 функциями, одна из которых - текстовая. Я хочу применить методы НЛП и создать пакет слов с помощью CountVectorizer. У меня вопрос: как я могу сохранить все 7 других функций с моей матрицей Bag of Words до моделирования?
from sklearn.feature_extraction.text import CountVectorizer
cv = CountVectorizer()
cv.fit(reviews_train_clean)
X = cv.transform(reviews_train_clean)
В настоящее время моя матрица Х - это только Мешок со словами, а я хочу Мешок со словами и другие функции (такие как Возраст, Зарплата ...)