Я прошел через джама и жеребенок (я кодирую в java).Оба они ожидают, что я буду использовать массивы так, чтобы число строк превышало число столбцов.
Но в случае Латентного семантического анализа (LSA) у меня есть 5 книг и всего 1000 нечетных слов.Когда я использую матрицу документа термина, я получаю матрицу 5 * 1000.
Поскольку это не работает, я вынужден транспонировать матрицу.При транспонировании я использую 1000 * 5.С 1000 * 5, когда я выполняю SVD, я получаю матрицу S с 5 * 5.Чтобы уменьшить размерность, матрица 5 * 5 выглядит маленькой.
Что можно сделать?