Я сделал один алгоритм, так что теперь я хочу найти оценку конкретного выхода, если он соответствует 70% или 80% с выходом.
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
data = pd.read_csv("clean_o2h.csv", sep=",")
reactants = data["reactants"].tolist()
targets = data["targets"].tolist()
# TFIDF vector representation
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(targets)
# Taking first record as test sample X[0:1]
cosine_similarities = cosine_similarity(X[0:1], X).flatten()
# Extract top 5 similarity records
similarity = cosine_similarities.argsort()[:-6:-1]
print("Top 5 recommendations...")
for sim in similarity:
print(reactants[sim])
Вывод
Top 5 recommendations...
NC1=NC(C)=C(C2=CC=C(S(=O)(C)=O)C(F)=C2)S1.O=C(N1C=CN=C1)N2C=CN=C2>C(Cl)Cl
CC(N1C=NC(CCN)=C1)C.O=C(N1C=CN=C1)NC2=NC(C)=C(C3=CC=C(S(=O)(C)=O)C(F)=C3)S2>CN(C)C=O.CCN(CC)CC
NCC1=NN=NN1.O=C(N1C=CN=C1)NC2=NC(C)=C(C3=CC=C(S(=O)(C)=O)C(F)=C3)S2>CCN(CC)CC
CC1=NC2=CC=CC=C2C(SCC(NN)=O)=C1.OC1=C(OC)C=C(C=O)C=C1OC>CCO.CC(O)=O
Но я хочу это со счетом, подобным
NC1=NC(C)=C(C2=CC=C(S(=O)(C)=O)C(F)=C2)S1.O=C(N1C=CN=C1)N2C=CN=C2>C(Cl)Cl 79.54%
CC(N1C=NC(CCN)=C1)C.O=C(N1C=CN=C1)NC2=NC(C)=C(C3=CC=C(S(=O)(C)=O)C(F)=C3)S2>CN(C)C=O.CCN(CC)CC 72.12%
NCC1=NN=NN1.O=C(N1C=CN=C1)NC2=NC(C)=C(C3=CC=C(S(=O)(C)=O)C(F)=C3)S2>CCN(CC)CC 68 %
CC1=NC2=CC=CC=C2C(SCC(NN)=O)=C1.OC1=C(OC)C=C(C=O)C=C1OC>CCO.CC(O)=O 55.0 %
. Вы можете мне помочь, как я могу найти счет и карту с выводом.