Предотвращение автоматического удаления строк / столбцов в представлении разреженной матрицы SciPy - PullRequest
0 голосов
/ 07 декабря 2018

В основном я пытаюсь k-кратно перекрестной проверки в Python (хотя пример, который я сейчас разрабатываю, является только проверкой).У меня есть разреженная матрица urm_all (более 99% разреженности), из которой я случайно выбираю.Процент обучения: train_perc.

    num_interactions = urm_all.nnz
    urm_all = urm_all.tocoo()

    train_mask = np.random.choice([True, False], num_interactions, [train_perc, 1-train_perc])

    urm_train = sps.coo_matrix((urm_all.data[train_mask], (urm_all.row[train_mask], urm_all.col[train_mask])))

Проблема возникает, когда я строю новую матрицу urm_train , поскольку иногда существуют нулевые строки / столбцы , которыеавтоматически удаляется представлением, что впоследствии приводит к ошибкам несоответствия формы .Есть ли способ избежать этого автоматического удаления ?

...