Я пытаюсь запустить LDA для группы птиц с радиотрекингом из разных стад, что я делал в течение нескольких зимних сезонов.В этом случае значения предикторов - это уровни сигналов от 4 радиобашен, в которых переменные класса являются стадами.Я думаю, что это творческое использование LDA в проектах с большими данными и, следовательно, может иметь отношение к другим.
Я использую пакет flipmultivariates и следил за этим сайтом, как мог: https://www.displayr.com/linear-discriminant-analysis-in-r-an-introduction/, и соответственно настраивал свои данные.Вот первые несколько строк:
structure(list(mfgID = c("337", "337", "337", "337", "337", "337"
), `month(ts)` = c(1, 1, 1, 1, 1, 1), `day(ts)` = 7:12, CP = c(NA,
NA, NA, NA, -63.32, -60.181), Elnina = c(NA, -24.1004, -25.5027,
-36.6236, -67.3128, NA), hans = c(-62.9033, -60.6047, NA, NA,
NA, NA), Nanoswamp = c(-47.0282, -41.3482, -49.6897, -53.9879,
NA, NA), flockID = c("EF", "EF", "EF", "EF", "EF", "EF")), class = "data.frame", row.names = c(NA,
-6L))
Я использую код:
lda1 <- LDA(flockID ~ Nanoswamp, hans , Elnina , CP,
data = FlocksforLDA2,
missing = "Exclude cases with missing data",
output = "Scatterplot")
Я получаю это сообщение об ошибке:
Ошибка вEstimaData (форма, данные, подмножество, веса, отсутствует, seed = seed): наблюдений меньше (0), чем переменных (2)
У меня довольно много NA, но ядумал, что отсутствующий строковый код выше разрешит это.Я использую пакет flipmultivariates, потому что он значительно упрощает код LDA и дает хорошие цифры, которые важны.
Если я пропустил что-то глупое, приношу свои извинения, но любая помощь очень ценится.