для начала, обратите внимание, что я новичок в статистике
вот фрагмент моего учебного набора данных, который содержит 4 полосы изображения (RGB и NIR) и соответствующий ему класс земного покрова (значение NIR все в 255поскольку у моего дрона не было необходимого датчика, но я планирую обновить его)
B1 B2 B3 B4 class_id
143 144 134 255 1
70 141 90 255 2
197 210 70 255 3
Я хочу проверить, является ли мой семантически помеченный class_id хорошим и достаточно четким, чтобы автоматическая классификация давала лучший прогноз
Мой друг сказал, что он использует описательную и логическую статистику, anova с функцией lm (серьезно, я ее вообще не понимаю)
Пробовал учебник, который использует
Summarize(class_id ~ B1 + B2 + B3, data=dfAll)
, но это толькофактор поддержки 2 и другие
Есть предложения?