IIU C и используя третью ссылку, которой вы поделились, вы можете преобразовать свои df
данные в разреженные данные, используя pd.SparseDtype
, например,
df_sparsed = df.astype(pd.SparseDtype("float", np.nan)
Вы можете узнать больше о pd.SparseDtype
здесь , чтобы выбрать правильные параметры для ваших данных, а затем использовать их в приведенной выше команде, например:
csr_matrix(df_sparsed.sparse.to_coo()) # Note you need .sparse accessor to access .to_coo()
Простой лайнер будет
csr_matrix(df.astype(pd.SparseDtype("float", np.nan)).sparse.to_coo())