Question

Я прошел через джама и жеребенок (я кодирую в java).Оба они ожидают, что я буду использовать массивы так, чтобы число строк превышало число столбцов.

Но в случае Латентного семантического анализа (LSA) у меня есть 5 книг и всего 1000 нечетных слов.Когда я использую матрицу документа термина, я получаю матрицу 5 * 1000.

Поскольку это не работает, я вынужден транспонировать матрицу.При транспонировании я использую 1000 * 5.С 1000 * 5, когда я выполняю SVD, я получаю матрицу S с 5 * 5.Чтобы уменьшить размерность, матрица 5 * 5 выглядит маленькой.

Что можно сделать?

John Lehmann · Answer 1 · 28 июня 2012

Размер используемого вами сегмента текста слишком велик.Документ (столбец) должен представлять страницу или несколько страниц текста, возможно, главу по большей части.Я также видел размер абзаца.

Проблемы со свд в яве

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Проблемы со свд в яве

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы