Как найти косинусное сходство между векторами?
Мне нужно найти сходство, чтобы измерить взаимосвязь между двумя строками текста.
Например, у меня есть два предложения типа:
система для пользовательского интерфейса
пользовательский интерфейс машины
… и их соответствующие векторы после tF-idf с последующей нормализацией с использованием, например, LSI
[1,0.5]
и [0.5,1]
.
Как мне измерить сходство между этими векторами?