Выберите только лучшие n функций из Tfidf Vectorizer - PullRequest
0 голосов
/ 13 июня 2018
var_vector = TfidfVectorizer()
train_var = var_vector.fit_transform(t_df['var'])

top_100 = np.array(var_vector.get_feature_names())
tfidf_100 = np.argsort(var_vector.idf_)[::-1]

n = 100
top_n = top_100[tfidf_100][:n]

Как мне обновить размерность до 100 после выбора 100 лучших слов из tfidf Vectorizer?

1 Ответ

0 голосов
/ 13 июня 2018

Установите аргумент max_features на 100.См. Документы здесь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...