Я нахожу косинусное сходство между документами .. Я сделал это так
D1 = (8,0,0,1) где 8,0,0,1 - оценки tf-idf слагаемых t1, t2, t3, t4
D2 = (7,0,0,1)
cos (theta) = (56 + 0 + 0 + 1) / sqrt (64 + 49) sqrt (1 +1)
, который получается
cos (тета) = 5
Теперь, что я оцениваю по этому значению ... Я не понимаю, что означает cos (theta) = 5 о сходстве между ними ... Я правильно все делаю?