Я хочу провести дискриминантный анализ со следующими характеристиками:
- две группы: несостоятельные (несостоятельные == 1) компании и платежеспособные компании (растворитель == 0)
- У каждой компании есть данные за два года
- Я хочу сравнить числа 1, 2 и 3 каждой неплатежеспособной компании с данными того же года всех платежеспособных компаний того же типа, что и неплатежеспособная компания
- дата события важна, потому что годы данных неплатежеспособных компаний должны быть определены как t-1 (один год до несостоятельности) и t-2 (два года до неплатежеспособности) для сравнения результатов на равном уровне
- группа платежеспособных компаний больше, чем несостоятельные компании
- исходный набор данных намного больше и содержит различные NA
Основная функция должна быть:
model = lda(formula= data$insolvent ~ data$number1 + data$number2 +
data$number3, data = data)
Но спецификации сложны ...
У вас есть идеи, как запустить это?
пример данных:
type = c(rep(c("A","B","C"), each = 2))
year = c(2008:2011)
ID = c(rep(1:12, each = 2))
Event = c(rep(c(2010,2012,2010,2012), each = 2),rep(0, each = 16))
insolvent = c(rep(1, each = 8), rep(0, each = 16))
number1 = c(5:7,1:12,6,8,10:16)
number2 = c(10:17,5:13,2:5,1:3)
number3 = c(1:5,8:13,12:24)
data = cbind.data.frame(ID,insolvent,type,Event,year,number1,number2,number3)
data