Я относительно новичок в R и собираюсь взять пример data.table. У меня есть данные о погашении кредита для пользователя, и я заполняю даты между каждой из зарегистрированных дат платежей, чтобы я мог рассчитать "оценочный"Оплата за сутки »в новом столбце.
Я работаю с этим набором данных , но создал обновленную "накопительную" таблицу, которая содержит соответствующие данные. R-код для получения таблицы накопленных данных приведен ниже:
library(ggplot2)
library(summarytools)
library(data.table)
library(dplyr)
dataset <- read.csv('anonymized_repmts.csv')
# Create column for repayment per day
dataset$repmt_per_day <- (dataset$repmt_amt / dataset$repmt_freq)
# Create column for cumulative amount
payments <- data.table(dataset, key = "uuid")
payments[, cumm_amt := cumsum(repmt_amt), uuid][]
# Cumulative payments dataset
cumulative <- payments[, .(uuid, repmt_date, repmt_amt, repmt_per_day, cumm_amt)]
Подводя итог, пользователь (ID: 001) ежемесячно выплачивает кредит по таблице накопленных данных, и я хотел бы добавитьстроки для каждого пользователя, которые показывают каждый день, который попадает между каждым зарегистрированным зарегистрированным погашением при создании нового столбца «repmnt_per_day», который оценивает ежедневный платеж. Я хотел бы заполнить пропущенные значения для столбцов, если это возможно.
Заранее благодарен за помощь, мне не нужны никакие ответы, а только некоторые рекомендации относительно пакета или инструмента, который я мог бы использоватьбыло бы удивительно!