Как я могу вычислить tf-idf и сохранить в df только значения слов запроса? - PullRequest
0 голосов
/ 19 апреля 2020

У меня есть список названий продуктов (df.product_title) и запрос (df.search_term) для каждого названия продукта.

vectorizer = TfidfVectorizer()
vectors=
vectorizer.fit_transform([df.product_title[0],df.search_term[0]])
feature_names = vectorizer.get_feature_names()
dense = vectors.todense()
denselist = dense.tolist()
df= pd.DataFrame(denselist, columns=feature_names)

В результате получается следующее:

            angl   bracket   simpson
      0  0.579739  0.000000  0.814802
      1  0.579739  0.814802  0.000000

Как сохранить в df только значение tfidif из запроса?

    df.search_term[0]=['angl','bracket'] 
    df.tfidf[0]=[0.579739, 0.814802]
...