показать dataframe ответственно с python - PullRequest
0 голосов
/ 16 мая 2019

Я создаю фрейм данных из 3 списков и хочу распечатать его (больше похоже на таблицу).

Вот мой код:

для doc1 в source_doc:

source_vec = vectorize(doc1)
# print(source_vec) 
for doc in target_docs:
    target_vec = vectorize(doc)

    sim_score = np.dot(source_vec, target_vec) / (np.linalg.norm(source_vec) * np.linalg.norm(target_vec))
    # print("source:", doc1, "target", doc, sim_score)
    # if sim_score >= threshold:
    # if doc1 not in index:                        
    index.append(doc1)
    colonnes.append(doc)
    score.append(sim_score)

data = pd.DataFrame (data = {'x': индекс, 'y': столбцы, 'z': оценка}) печать (данные)

Я не знаю, есть ли там что-то пропущенное в моем коде.

Спасибо

1 Ответ

0 голосов
/ 16 мая 2019

Из этого кода вы должны получить выходные три столбца (document1, document2, Similarity_score), где каждый из document1, document2 представляет собой массив numpy

Вывод для строки образца может выглядеть следующим образом: [1, 2, ...] ;; [1, 2, ...] ;; 0,5 (;; это некоторый интервал)

Я бы порекомендовал добавить имена столбцов в pd.DataFrame

data = pd.DataFrame(data={'x':index, 'y':colonnes, 'z':score}, index=['source_document', 'target_document', 'similarity_score'])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...