Проблемы со свд в яве - PullRequest
       61

Проблемы со свд в яве

0 голосов
/ 02 февраля 2012

Я прошел через джама и жеребенок (я кодирую в java).Оба они ожидают, что я буду использовать массивы так, чтобы число строк превышало число столбцов.

Но в случае Латентного семантического анализа (LSA) у меня есть 5 книг и всего 1000 нечетных слов.Когда я использую матрицу документа термина, я получаю матрицу 5 * 1000.

Поскольку это не работает, я вынужден транспонировать матрицу.При транспонировании я использую 1000 * 5.С 1000 * 5, когда я выполняю SVD, я получаю матрицу S с 5 * 5.Чтобы уменьшить размерность, матрица 5 * 5 выглядит маленькой.

Что можно сделать?

1 Ответ

0 голосов
/ 28 июня 2012

Размер используемого вами сегмента текста слишком велик.Документ (столбец) должен представлять страницу или несколько страниц текста, возможно, главу по большей части.Я также видел размер абзаца.

...