Как добавить больше функций в текст, в котором CountVectorizer уже был применен при обработке естественного языка Python - PullRequest
0 голосов
/ 25 апреля 2019

В настоящее время я работаю над набором данных для обработки естественного языка.

Мне удалось очистить текст, и я сгенерировал больше функций из текстовой функции. Я преобразовал текстовую функцию, используя CountVectorizer, чтобы иметь возможность обучать данные.

Однако я стремлюсь добавить больше функций к этому преобразованному тексту, но не могу понять, как это сделать

    from sklearn.feature_extraction.text import CountVectorizer as cv
    from sklearn.feature_extraction.text import TfidfTransformer as tft

    vect=cv(stop_words='english',lowercase=True) 
    count=vect.fit_transform(X['comment_text'])

Как и в приведенном выше коде, мне нужно добавить функцию, например. data['no_words'] считать. Как я могу это сделать?

...