Скрытое семантическое индексирование - PullRequest
0 голосов
/ 29 июля 2010

Я пытаюсь выяснить, как выполнить умножение матриц, полученных после реализации SVD в LSI. Мне нужно это для моих исследований. Я хочу провести кластеризацию документов.

1 Ответ

0 голосов
/ 17 марта 2011

Из того, что я прочитал, после того, как вы разложите матрицу терминологического документа с помощью SVD для создания [U, S, V], вам нужно будет умножить сингулярные значения S на левую факторную матрицу V '. V '- это ваша матрица пространства документов, которая масштабируется по единичным значениям. Косинусное сходство строк результирующей матрицы должно дать вам сходство документов.

...