я пытаюсь взять 6 лучших книг из моего csv из 8371 книг.Я вынул 6 лучших книг, и я хотел бы сделать цикл for, чтобы я мог получить все свои 8371 книг со списком из 6 более соответствующих книг, добавленных рядом с каждой книгой
def tf_similarity(s1, s2):
def add_space(s):
return ' '.join(list(s))
s1, s2 = add_space(s1), add_space(s2)
cv = CountVectorizer(tokenizer=lambda s: s.split())
corpus = [s1, s2]
vectors = cv.fit_transform(corpus).toarray()
return np.dot(vectors[0], vectors[1]) / (norm(vectors[0]) * norm(vectors[1]))
for j in range(0,1):
for i in range(8371):
titles.append(tf_similarity(str(document[i]), document[j]))
df = pd.DataFrame()
df["document"] = document
df["titles"] = titles
dff = df.sort_values("titles", ascending=False).head(6)
newdff=dff.values.T.tolist()
new=newdff[0]
for k in range(0,2):
boolist.append(new)
Я хотел бымой список выглядит примерно так:
book1 top1 top2 top3 top4 top5 top6
book2 top1 top2 top3 top4 top5 top6