LSA - шаги после нахождения СВД - PullRequest
1 голос
/ 19 января 2012

Я прочитал довольно много уроков с утра.Моя проблема заключается в поиске сходства между двумя документами.Я с нетерпением жду возможности использовать LSA в Java для этой цели.

Я понял создание матрицы терминов, а затем к ней применяется SVD (размерность уменьшается)3 Матрицы получаются как результаты. Это может звучать глупо, но я застрял с этим довольно долго.Теперь, если мне нужно найти сходство между двумя документами, что мне делать?

1 Ответ

0 голосов
/ 28 января 2012

После расчета 3 матриц с использованием SVD необходимо рассчитать корреляцию между векторами двух документов, которые вы хотите сравнить. Вы можете использовать корреляцию Спирмена. Другой способ - использование косинусного расстояния.

Более подробную информацию вы найдете на LSA , полный пример с пояснениями.

Вы можете искать некоторые библиотеки Java для LSA.

...