какой статистический c значимый тест использовать для эталонных наборов данных - PullRequest
0 голосов
/ 10 января 2020

Я был бы чрезвычайно признателен, если бы кто-то смог уточнить, к какому типу набора данных относятся следующие (обычный, номинальный, порядковый, интервальный) и какой статистический тест относится к такому набору данных.

Я сравнил 3 разных типы классификаторов машинного обучения, а именно: логистика c регрессия (lr), случайный лес (rf) и SVM (svm), а также приведенная ниже средняя точность для каждого учащегося по 6 наборам данных. Я заметил, что во многих сравнительных исследованиях выбираются T-критерий (для парных) и линейная модель (ANOVA). Будучи новичком, я не понимаю, являются ли мои переменные (lr, rf, svm) независимыми переменными и имеют ли они тип данных normal? И поэтому я должен выбрать тест ANOVA.

Заранее спасибо за ваше время.

dataset                 lr        rf         svm   

analcatdata_gviolence  0.9950    0.9960    0.9959
transplant             0.9855    0.9955    0.9890
kr-vs-kp               0.9707    0.9840    0.9800
mfeat-factors          0.9698    0.9800    0.9760
analcatdata_creditscore 0.949    0.9558    0.9694
rabe_266               0.9425    0.9600    0.9556           
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...