У меня есть предложение и ключевое предложение вроде этого.
doc1 = "the normal duration of massage is an hour"
doc2 = "the best technique applied on our massage"
key = "duration massage"
Я пытаюсь выбрать предложение, используя ключ с TF-IDF. Я предварительно обработал это предложение так, чтобы вывод был таким: вот так
res1:
(0,1) 0.5761523551647353
(0,2) 0.40993714596036396
(0,0) 0.40993714596036396
(0,3) 0.5761523551647353
(1,2) 0,7071067811865475
(1,0) 0,7071067811865475
res2:
(0,3) 0.37997836159100784
(0,0) 0.534046329052269
(0,4) 0.534046329052269
(0,1) 0.534046329052269
(1,2) 0.8148024746671689
(1,3) 0.5797386715376657
Что я собираюсь спросить, это число, что означает это число? Я знаю, что это, очевидно, TF-IDF, но я не понимаю, что означает это число. Я хочу выбрать из 2 предложений, которое является самым весомым, но я не понимаю, как я могу взвесить предложение в зависимости от веса слова? Нужно ли мне использовать сходство, но я не понимаю, почему мне нужно использовать сходство, поскольку я хочу найти, какое предложение, а не расстояние? Спасибо:)