Эффективно инициализируйте редкую матрицу - PullRequest
0 голосов
/ 08 декабря 2018

У меня есть массив с m строками и массивами в качестве значений, которые указывают индекс столбцов и ограничены большим числом n.Например:

 Y = [[1,34,203,2032],...,[2984]]

Теперь я хочу эффективный способ инициализации разреженной матрицы Numpy с размерами m, n и значениями, соответствующими Y (X [i, j] = 1, если j находится в Y [i], = 0 в противном случае).

1 Ответ

0 голосов
/ 09 декабря 2018

Ваши данные уже близки к формату csr, поэтому я предлагаю использовать это:

import numpy as np
from scipy import sparse
from itertools import chain

# create an example    
m, n = 20, 10
X = np.random.random((m, n)) < 0.1
Y = [list(np.where(y)[0]) for y in X]

# construct the sparse matrix
indptr = np.fromiter(chain((0,), map(len, Y)), int, len(Y) + 1).cumsum()
indices = np.fromiter(chain.from_iterable(Y), int, indptr[-1])
data = np.ones_like(indices)    
S = sparse.csr_matrix((data, indices, indptr), (m, n))
# or    
S = sparse.csr_matrix((data, indices, indptr))

# check
assert np.all(S==X)
...