В основном я пытаюсь k-кратно перекрестной проверки в Python (хотя пример, который я сейчас разрабатываю, является только проверкой).У меня есть разреженная матрица urm_all (более 99% разреженности), из которой я случайно выбираю.Процент обучения: train_perc.
num_interactions = urm_all.nnz
urm_all = urm_all.tocoo()
train_mask = np.random.choice([True, False], num_interactions, [train_perc, 1-train_perc])
urm_train = sps.coo_matrix((urm_all.data[train_mask], (urm_all.row[train_mask], urm_all.col[train_mask])))
Проблема возникает, когда я строю новую матрицу urm_train , поскольку иногда существуют нулевые строки / столбцы , которыеавтоматически удаляется представлением, что впоследствии приводит к ошибкам несоответствия формы .Есть ли способ избежать этого автоматического удаления ?