Я работаю над tf-idf, используя конвейеры pandas.Я использую схему взвешивания lnc.ltc
из нотации SMART .
query = 'some string'
pipeline = Pipeline([
('vect', CountVectorizer(stop_words='english')),
('tfidf', TfidfTransformer(norm='l2', use_idf=False, smooth_idf=False, sublinear_tf=True)),
])
doc_vectors = pipeline.fit_transform(data).toarray()
query_vector = pipeline.transform([query]).toarray()
Для векторов документов я хочу установить use_idf=False
, что уже сделано.Но как мне установить use_idf=True
для вектора запроса?
Я попытался напрямую изменить параметр use_idf
, но он не работает.