В настоящее время я работаю над набором данных для обработки естественного языка.
Мне удалось очистить текст, и я сгенерировал больше функций из текстовой функции. Я преобразовал текстовую функцию, используя CountVectorizer
, чтобы иметь возможность обучать данные.
Однако я стремлюсь добавить больше функций к этому преобразованному тексту, но не могу понять, как это сделать
from sklearn.feature_extraction.text import CountVectorizer as cv
from sklearn.feature_extraction.text import TfidfTransformer as tft
vect=cv(stop_words='english',lowercase=True)
count=vect.fit_transform(X['comment_text'])
Как и в приведенном выше коде, мне нужно добавить функцию, например. data['no_words']
считать. Как я могу это сделать?