Как идиоматический способ Панды расширить столбец, содержащий JSON-массив наблюдений, в дополнительные строки?
В приведенном ниже примере Out[3]
- это DataFrame
, содержащий данные о кредите. Существует один ряд на кредит. Столбцы Loan ID
, Start Date
, End Date
и Amount
не меняются в течение срока действия кредита. Ноль или более платежей с отметкой даты кодируются в столбец Payments
в виде массива JSON (строка).
Целевой вывод в Out[5]
показывает цель. Одна или несколько строк на исходную строку с каждым платежом от Payments
, приводящим к созданию новой строки в выходных данных.
Я сделал это двумя способами: с iterrows
, который выглядит вменяемым и легким для чтения, и с запутанным, несколько волнистым подходом, где я вытягиваю фиксированные атрибуты в индекс, чтобы сохранить их, затем melt
и переиндексировать.
Должен быть лучший способ! Пожалуйста, поделитесь секретами мастеров панд:)