У меня есть n
CSV, каждый из которых имеет идентичный формат (одинаковое k
количество функций). Я надеюсь построить 2d массив dask n
образец по k
функциям массива dask для PCA, построения моделей и т. Д.
Я считал их в кадр данных dask, используя dd.read_csv ("* _ all_csvs.csv"), после чего мой кадр данных dask в основном просто sample
, feature
, feature_value
. Существует ли эффективный способ преобразования мультииндексированного фрейма данных в двумерный массив данных с разбивкой n
образцов по k
функциям?