У меня есть pandas dataframe со столбцами в виде (Date, SKUID, SALES). Date: данные за 4 года. SKUID: множественный ID. Продажи: продажи соответствующего идентификатора на дневном уровне.
.SKU, чтобы я мог прогнозировать каждую серию, т. Е. Каждую SKU в данном кластере, создавая модели для каждого кластера.
Для кластеризации временных рядов я использую пакет TSFRESH, из которого я извлекаю функции каждой серииа затем кластеризовать эти функции.
Но я застрял при получении соответствующих функций.
#to extract relevant features
f = tsfresh.extract_features( df, column_id = "SKUID", column_sort = "DATE" )
#f gives me a dataframe having row as each SKUID and columns as features (around 600)
y=df[['SKUID','Sales']]
f_1=impute(f)
tsfresh.feature_selection.relevance.calculate_relevance_table(f_1,y,ml_task='auto')
Ошибка: Объект 'DataFrame' не имеет атрибута 'dtype'
Я хочу вернуть соответствующие функции, которые могут быть сгруппированы на следующем шаге.
Есть ли другой способ, которым я могу достичь этого ??можно использовать любой другой алгоритм для получения соответствующей функции?