Как создать все возможные комбинации pandas столбцов? - PullRequest
4 голосов
/ 26 апреля 2020

Рассмотрим следующее pandas DF:

col1 col2 col3
1    3     1
2    4     2
3    1     3
4    0     1
2    4     0
3    1     5

Как создать все возможные суммы комбинаций для всех значений каждого pandas кадра данных? Например:

col1 col2 col3 col1_col2 col1_col3 col2_col3
1    3     1       4        2        4   
2    4     2       6        4        6
3    1     3       4        6        4
4    0     1       4        5        1
2    4     0       6        2        4
3    1     5       4        8        6

Есть идеи, как получить все возможные значения комбинаций сумма / столбец в новых столбцах?

1 Ответ

4 голосов
/ 26 апреля 2020

Используйте itertools.combinations с f-string s для форматирования имен новых столбцов:

from  itertools import combinations

for i, j in combinations(df.columns, 2):
    df[f'{i}_{j}'] = df[i] + df[j]

print (df)
   col1  col2  col3  col1_col2  col1_col3  col2_col3
0     1     3     1          4          2          4
1     2     4     2          6          4          6
2     3     1     3          4          6          4
3     4     0     1          4          5          1
4     2     4     0          6          2          4
5     3     1     5          4          8          6

Решение с list comprehension, concat и DataFrame.join для добавления к оригиналу:

dfs = [(df[i] + df[j]).rename(f'{i}_{j}') for i, j in combinations(df.columns, 2)]
df = df.join(pd.concat(dfs, axis=1))
print (df)
   col1  col2  col3  col1_col2  col1_col3  col2_col3
0     1     3     1          4          2          4
1     2     4     2          6          4          6
2     3     1     3          4          6          4
3     4     0     1          4          5          1
4     2     4     0          6          2          4
5     3     1     5          4          8          6
...