Выполнение дискриминантного анализа прогноза несостоятельности с данными временных рядов в R - PullRequest
0 голосов
/ 09 октября 2018

Я хочу провести дискриминантный анализ со следующими характеристиками:

  • две группы: несостоятельные (несостоятельные == 1) компании и платежеспособные компании (растворитель == 0)
  • У каждой компании есть данные за два года
  • Я хочу сравнить числа 1, 2 и 3 каждой неплатежеспособной компании с данными того же года всех платежеспособных компаний того же типа, что и неплатежеспособная компания
  • дата события важна, потому что годы данных неплатежеспособных компаний должны быть определены как t-1 (один год до несостоятельности) и t-2 (два года до неплатежеспособности) для сравнения результатов на равном уровне
  • группа платежеспособных компаний больше, чем несостоятельные компании
  • исходный набор данных намного больше и содержит различные NA
  • Основная функция должна быть:

    model = lda(formula= data$insolvent ~ data$number1 + data$number2 +
    data$number3, data = data)
    

Но спецификации сложны ...

У вас есть идеи, как запустить это?

пример данных:

type = c(rep(c("A","B","C"), each = 2))
year = c(2008:2011)
ID = c(rep(1:12, each = 2))
Event = c(rep(c(2010,2012,2010,2012), each = 2),rep(0, each = 16))
insolvent = c(rep(1, each = 8), rep(0, each = 16))
number1 = c(5:7,1:12,6,8,10:16)
number2 = c(10:17,5:13,2:5,1:3)
number3 = c(1:5,8:13,12:24)
data = cbind.data.frame(ID,insolvent,type,Event,year,number1,number2,number3)
data
...