построить комбинированный столбец в dask dataframe для сортировки - PullRequest
0 голосов
/ 31 августа 2018

Сортировка в сумерках

на основе этого ответа я хочу построить объединенный столбец динамически

df_post['sort_column'] = df_post.apply(lambda r:str([r[col1],r[col2],r[col3]]), axis=1)
df_post = df_post.set_index('sort_column')
df_post = df_post.map_partitions(lambda x: x.sort_index())

Я не могу найти способ сделать это '[r [col1], r [col2], r [col3]]' динамическим, основываясь на списке столбцов, предоставленном конфигурационным файлом.

1 Ответ

0 голосов
/ 31 августа 2018

Сложно сказать, что за вопрос, но предположим, что это «я хотел бы применить решение в связанном ответе, но для списка имен столбцов». Это может выглядеть как

df_post['sort_column'] = df_post.apply(lambda r:str([r[c] for c in columns]), axis=1)
df_post = df_post.set_index('sort_column')
df_post = df_post.map_partitions(lambda x: x.sort_index())

, где columns было получено из файла конфигурации заранее.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...