Сводная таблица против группы по Pandas - PullRequest
0 голосов
/ 01 марта 2020
loan_amnt   funded_amnt term    int_rate    grade   annual_inc  issue_d dti revol_bal   total_pymnt loan_status

0 2500 2500 36 месяцев 13.56 C 55000.0 De c -2018 18.24 4341 167.02 Ток 1 30000 30000 60 месяцев 18.94 D 90000.0 De c -2018 26.52 12315 1507.11 Ток 2 5000 5000 36 месяцев 17.97 D 59280,0 De c -2018 10,51 4599 353,89 Ток 3 4000 4000 36 месяцев 18,94 D 92000,0 De c -2018 16,74 5468 286,71 Ток 4 30000 30000 60 месяцев 16,14 C 57250,0 De c -2018 26,35 829 1423,21 Ток

Я работаю над набором данных с данными ссуды (каждая строка является ссудой, а каждый столбец - метрикой c, связанной с ссудой). В столбце status_mapped есть 2 значения: полностью оплачено и по умолчанию. Я хочу создать сводную таблицу, где я смотрю по годам и по классам, какова ставка по умолчанию. Для меня это то, что было бы просто в сводной таблице Excel, но, глядя на сводные таблицы Pandas, я не был уверен, что делать дальше. Я полагаю, что я использовал бы index ['year'], columns = ['grades'], и функция для расчета ставок по умолчанию будет # числом дефолтов / общим числом кредитов по группам, но я не могу понять, как включить это в бит аггфункции функциональности сводной таблицы. Будет ли это проще использовать group by?

...