Как показать процентную рекомендацию в алгоритме TFIDF? - PullRequest
0 голосов
/ 27 апреля 2020

Я сделал один алгоритм, так что теперь я хочу найти оценку конкретного выхода, если он соответствует 70% или 80% с выходом.

import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

data = pd.read_csv("clean_o2h.csv", sep=",")

reactants = data["reactants"].tolist()
targets = data["targets"].tolist()

# TFIDF vector representation
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(targets)
# Taking first record as test sample X[0:1]
cosine_similarities = cosine_similarity(X[0:1], X).flatten()

# Extract top 5 similarity records
similarity = cosine_similarities.argsort()[:-6:-1]
print("Top 5 recommendations...")
for sim in similarity:
    print(reactants[sim])

Вывод

Top 5 recommendations...

NC1=NC(C)=C(C2=CC=C(S(=O)(C)=O)C(F)=C2)S1.O=C(N1C=CN=C1)N2C=CN=C2>C(Cl)Cl
CC(N1C=NC(CCN)=C1)C.O=C(N1C=CN=C1)NC2=NC(C)=C(C3=CC=C(S(=O)(C)=O)C(F)=C3)S2>CN(C)C=O.CCN(CC)CC
NCC1=NN=NN1.O=C(N1C=CN=C1)NC2=NC(C)=C(C3=CC=C(S(=O)(C)=O)C(F)=C3)S2>CCN(CC)CC
CC1=NC2=CC=CC=C2C(SCC(NN)=O)=C1.OC1=C(OC)C=C(C=O)C=C1OC>CCO.CC(O)=O

Но я хочу это со счетом, подобным

    NC1=NC(C)=C(C2=CC=C(S(=O)(C)=O)C(F)=C2)S1.O=C(N1C=CN=C1)N2C=CN=C2>C(Cl)Cl   79.54%
    CC(N1C=NC(CCN)=C1)C.O=C(N1C=CN=C1)NC2=NC(C)=C(C3=CC=C(S(=O)(C)=O)C(F)=C3)S2>CN(C)C=O.CCN(CC)CC 72.12%
    NCC1=NN=NN1.O=C(N1C=CN=C1)NC2=NC(C)=C(C3=CC=C(S(=O)(C)=O)C(F)=C3)S2>CCN(CC)CC 68 %
    CC1=NC2=CC=CC=C2C(SCC(NN)=O)=C1.OC1=C(OC)C=C(C=O)C=C1OC>CCO.CC(O)=O 55.0 %

. Вы можете мне помочь, как я могу найти счет и карту с выводом.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...