разреженная матрица свд в питоне - PullRequest
6 голосов
/ 13 июля 2010

Кто-нибудь знает, как выполнить операцию SVD на разреженной матрице в Python? Похоже, что в scipy.sparse.linalg такой функциональности нет.

Ответы [ 4 ]

4 голосов
/ 22 октября 2010

Похоже, sparsesvd это то, что вы ищете! SVDLIBC эффективно обернут в Python (без дополнительных копий данных, сделанных в RAM).

Просто запустите "easy_install sparsesvd" для установки.

3 голосов
/ 01 октября 2010

Вы можете попробовать scipy.sparse.linalg.svd , хотя документация все еще находится в стадии разработки и, следовательно, довольно лаконична.

3 голосов
/ 14 июля 2010

Вы можете использовать библиотеку Divisi для этого;с домашней страницы:

  • Это библиотека, написанная на Python, использующая библиотеку C (SVDLIBC) для выполнения разреженной операции SVD с использованием алгоритма Ланцоша.Другие математические вычисления выполняются NumPy.
2 голосов
/ 10 апреля 2012

Простой пример использования python-recsys library:

from recsys.algorithm.factorize import SVD

svd = SVD()
svd.load_data(dataset)
svd.compute(k=100, mean_center=True)

ITEMID1 = 1  # Toy Story
svd.similar(ITEMID1)
# Returns:
# [(1,    1.0),                 # Toy Story
#  (3114, 0.87060391051018071), # Toy Story 2
#  (2355, 0.67706936677315799), # A bug's life
#  (588,  0.5807351496754426),  # Aladdin
#  (595,  0.46031829709743477), # Beauty and the Beast
#  (1907, 0.44589398718134365), # Mulan
#  (364,  0.42908159895574161), # The Lion King
#  (2081, 0.42566581277820803), # The Little Mermaid
#  (3396, 0.42474056361935913), # The Muppet Movie
#  (2761, 0.40439361857585354)] # The Iron Giant

ITEMID2 = 2355 # A bug's life
svd.similarity(ITEMID1, ITEMID2)
# 0.67706936677315799
...