Проблемы с использованием Jama в Java для LSA - PullRequest
1 голос
/ 30 января 2012

Я использую пакет jama для поиска lsa. Мне сказали уменьшить размерность и, следовательно, я уменьшил ее до 3 в этом случае, и я реконструирую матрицу. Но результирующая матрица сильно отличается от той, которую я дал системе

вот код

    a = new Matrix(termdoc); // get the matrix here 
    a = a.transpose() ; // since the matrix is in the form of doc * terms i transpose it 
    SingularValueDecomposition sv =new SingularValueDecomposition(a) ; 
    u = sv.getU();
    v = sv.getV(); 
    s = sv.getS();
    uarray = u.getArray();
    sarray = s.getArray(); 
    varray = v.getArray(); 
    sarray_mod = new double[3][3]; //reducing dimension 
    uarray_mod = new double[uarray.length][3];
    varray_mod = new double[3][varray.length]; 
    move(sarray,3,3,sarray_mod); // my method to move the contents 
    move(uarray,uarray.length,3,uarray_mod); 
    move(varray,3,varray.length,varray_mod); 
    e = new Matrix(uarray_mod); 
    f = new Matrix(sarray_mod);
    g = new Matrix(varray_mod);
    Matrix temp  =e.times(f); 
    result = temp.times(g); 
    result = result.transpose(); 
    results = result.getArray() ; 
    System.out.println(" The array after svd : \n"); 
    print(results);// my method to print the array 

 private static void move(double[][] sarray2, int r, int c,
        double[][] sarrayMod) {
    // TODO Auto-generated method stub 
    for(int i=0;i<r;i++)
        for(int t=0;t<c;t++)
            sarrayMod[i][t]=sarray2[i][t];

}

Пример вывода всего с 3 файлами, два из которых похожи

0.25 0 0 0 0 0 0 0 0.25 0 0.25 0.25 0 

0 0.083 0.083 0.083 0.083 0.083 0.083 0.083 0 0.083 0.083 0.167 0.083 

0.25 0 0 0 0 0 0 0 0.25 0 0.25 0.25 0 

Массив после свд:

0.225 0.029 0.029 0.029 0.029 0.029 0.029 0.029 0.225 0.029 0.253 0.282 0.029 

-0.121 0.077 0.077 0.077 0.077 0.077 0.077 0.077 -0.121 0.077 -0.044 0.033 0.077 

0.245 0.012 0.012 0.012 0.012 0.012 0.012 0.012 0.245 0.012 0.257 0.269 0.012 

1 Ответ

1 голос
/ 31 января 2012

Перейти к примеру Здесь

В примере мы берем первые 2 столбца из U, S и V. И затем мы умножаем их. Это не даст вам ту же матрицу, но повысит производительность в подобии.

Если вы прошли этот пример, вы обнаружите, что сходство между пользователем и человеком было в -ve. Но после того, как мы выполнили SVD, сходство увеличилось до значения + ve, близкого к 1.

Я думаю, что вы движетесь правильно. Просто пройдите пример один раз.

...