TF-IDF к весу приговора - PullRequest
       11

TF-IDF к весу приговора

0 голосов
/ 21 февраля 2020

У меня есть предложение и ключевое предложение вроде этого.

doc1 = "the normal duration of massage is an hour"
doc2 = "the best technique applied on our massage"
key = "duration massage"

Я пытаюсь выбрать предложение, используя ключ с TF-IDF. Я предварительно обработал это предложение так, чтобы вывод был таким: вот так

res1:
(0,1)    0.5761523551647353
(0,2)    0.40993714596036396
(0,0)    0.40993714596036396
(0,3)    0.5761523551647353
(1,2)    0,7071067811865475
(1,0)    0,7071067811865475
res2:
(0,3)    0.37997836159100784
(0,0)    0.534046329052269
(0,4)    0.534046329052269
(0,1)    0.534046329052269
(1,2)    0.8148024746671689
(1,3)    0.5797386715376657

Что я собираюсь спросить, это число, что означает это число? Я знаю, что это, очевидно, TF-IDF, но я не понимаю, что означает это число. Я хочу выбрать из 2 предложений, которое является самым весомым, но я не понимаю, как я могу взвесить предложение в зависимости от веса слова? Нужно ли мне использовать сходство, но я не понимаю, почему мне нужно использовать сходство, поскольку я хочу найти, какое предложение, а не расстояние? Спасибо:)

...