Я был бы чрезвычайно признателен, если бы кто-то смог уточнить, к какому типу набора данных относятся следующие (обычный, номинальный, порядковый, интервальный) и какой статистический тест относится к такому набору данных.
Я сравнил 3 разных типы классификаторов машинного обучения, а именно: логистика c регрессия (lr), случайный лес (rf) и SVM (svm), а также приведенная ниже средняя точность для каждого учащегося по 6 наборам данных. Я заметил, что во многих сравнительных исследованиях выбираются T-критерий (для парных) и линейная модель (ANOVA). Будучи новичком, я не понимаю, являются ли мои переменные (lr, rf, svm) независимыми переменными и имеют ли они тип данных normal? И поэтому я должен выбрать тест ANOVA.
Заранее спасибо за ваше время.
dataset lr rf svm
analcatdata_gviolence 0.9950 0.9960 0.9959
transplant 0.9855 0.9955 0.9890
kr-vs-kp 0.9707 0.9840 0.9800
mfeat-factors 0.9698 0.9800 0.9760
analcatdata_creditscore 0.949 0.9558 0.9694
rabe_266 0.9425 0.9600 0.9556