Question

я пытаюсь взять 6 лучших книг из моего csv из 8371 книг.Я вынул 6 лучших книг, и я хотел бы сделать цикл for, чтобы я мог получить все свои 8371 книг со списком из 6 более соответствующих книг, добавленных рядом с каждой книгой

def tf_similarity(s1, s2):
def add_space(s):
    return ' '.join(list(s))

s1, s2 = add_space(s1), add_space(s2)

cv = CountVectorizer(tokenizer=lambda s: s.split())
corpus = [s1, s2]
vectors = cv.fit_transform(corpus).toarray()

return np.dot(vectors[0], vectors[1]) / (norm(vectors[0]) * norm(vectors[1]))

for j in range(0,1): 

    for i in range(8371):
        titles.append(tf_similarity(str(document[i]), document[j]))


    df = pd.DataFrame()
    df["document"] = document
    df["titles"] = titles
    dff = df.sort_values("titles", ascending=False).head(6)
    newdff=dff.values.T.tolist()
    new=newdff[0]
for k in range(0,2):
    boolist.append(new)

Я хотел бымой список выглядит примерно так:

book1 top1 top2 top3 top4 top5 top6
book2 top1 top2 top3 top4 top5 top6

dataframe возьмите head () для вывода и добавления

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

dataframe возьмите head () для вывода и добавления

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов