Как я могу вставить пропущенные строки дат и заполнить пропущенные значения для других столбцов на основе другого столбца? - PullRequest
1 голос
/ 02 ноября 2019

Я относительно новичок в R и собираюсь взять пример data.table. У меня есть данные о погашении кредита для пользователя, и я заполняю даты между каждой из зарегистрированных дат платежей, чтобы я мог рассчитать "оценочный"Оплата за сутки »в новом столбце.

Я работаю с этим набором данных , но создал обновленную "накопительную" таблицу, которая содержит соответствующие данные. R-код для получения таблицы накопленных данных приведен ниже:

library(ggplot2)
library(summarytools)
library(data.table)
library(dplyr)

dataset <- read.csv('anonymized_repmts.csv')

# Create column for repayment per day

dataset$repmt_per_day <- (dataset$repmt_amt / dataset$repmt_freq)

# Create column for cumulative amount

payments <- data.table(dataset, key = "uuid")
payments[, cumm_amt := cumsum(repmt_amt), uuid][]

# Cumulative payments dataset

cumulative <- payments[, .(uuid, repmt_date, repmt_amt, repmt_per_day, cumm_amt)]

Подводя итог, пользователь (ID: 001) ежемесячно выплачивает кредит по таблице накопленных данных, и я хотел бы добавитьстроки для каждого пользователя, которые показывают каждый день, который попадает между каждым зарегистрированным зарегистрированным погашением при создании нового столбца «repmnt_per_day», который оценивает ежедневный платеж. Я хотел бы заполнить пропущенные значения для столбцов, если это возможно.

Заранее благодарен за помощь, мне не нужны никакие ответы, а только некоторые рекомендации относительно пакета или инструмента, который я мог бы использоватьбыло бы удивительно!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...