Одинаковая функция для всех столбцов в DataFrame - PullRequest
1 голос
/ 13 января 2020

Мои данные содержат 75 столбцов. Я хочу вычислить функцию ниже для всех столбцов отдельно и хочу написать фрейм данных.

Столбцы моих данных,

df3.columns

Index(['R_26', 'R_31', 'R_38', 'R_65', 'R_71', 'R_86', 'R_25', 'R_63', 'R_59',
   'R_19', 'R_35', 'R_84', 'R_24', 'R_68', 'S_15', 'R_85', 'R_57', 'R_22',
   'R_30', 'R_15', 'R_16', 'R_69', 'S_16', 'R_6', 'R_87', 'R_40', 'R_20',
   'R_17', 'R_18', 'R_21', 'R_28', 'S_9', 'R_33', 'R_56', 'S_10', 'R_7',
   'S_8', 'R_29', 'R_1', 'R_66', 'S_18', 'S_6', 'R_64', 'R_34', 'R_37',
   'R_3', 'R_54', 'R_67', 'S_22', 'R_13', 'R_48', 'S_11', 'R_58', 'S_23',
   'S_3', 'S_4', 'R_60', 'S_7', 'R_32', 'S_5', 'R_51', 'R_8', 'R_10',
   'R_9', 'S_14', 'R_62', 'S_17', 'S_21', 'R_14', 'R_55', 'R_2', 'R_50',
   'R_49', 'R_53', 'FRAUD'],
  dtype='object')

Моя функция (выполняется только для 1 образца 'R_26');

df4 = df3[df3.R_26 == 1]
Sm = df4.R_26.sum()
Fr = df4.FRAUD.sum()
Rate = b / a

Как я хочу выборка фрейма данных;


Скорость столбца


R_26 0,15 R_31 0,45. , , , , .

1 Ответ

1 голос
/ 13 января 2020

Вы можете использовать DataFrame.melt для разворота, затем фильтровать 1 значения по DataFrame.query, агрегировать sum, создать Rate столбец по DataFrame.assign с Series.div для деления и DataFrame.pop для извлечения столбцов и последнего преобразования индекса в столбец по DataFrame.reset_index:

df = (df3.melt('FRAUD')
        .query('value == 1')
        .groupby('variable')
        .sum()
        .assign(Rate = lambda x: x.pop('FRAUD').div(x.pop('value')))
        .reset_index())
print (df)
...