Как классифицировать мультиклассовые данные с разной вероятностью отсечки в Weka - PullRequest
1 голос
/ 01 июня 2019

Weka устанавливает отсечение по умолчанию (то есть 50%), чтобы различать данные двух классов и может легко классифицировать по разным отсечениям, используя SelectThreshold классификатор в интерфейсе Weka. Теперь в данных трех классов Weka выберет наибольшую вероятность, скажем, с вероятностью 0,333, 0,421, 0,246, Weka выберет 0,421. Но в этом классе невозможно выбрать пользовательскую обрезку вручную. Есть ли какой-нибудь метод, с помощью которого я могу выполнить эту задачу, или кто-то может помочь мне понять концепцию пользовательского отсечения в данных нескольких классов.

пример данных двух классов

inst#,    actual, predicted, error, probability distribution
 1       1:+1       1:+1         *0.814  0.186
 2       1:+1       1:+1         *1      0    
 3       1:+1       1:+1         *0.58   0.42 
 4       1:+1       2:-1      +   0.294 *0.706
 5       1:+1       1:+1         *0.796  0.204
 6       1:+1       1:+1         *0.989  0.011
 7       1:+1       2:-1      +   0.294 *0.706
 8       1:+1       1:+1         *0.814  0.186

пример данных трех классов

inst#,    actual, predicted, error, probability distribution
 1       1:+1       1:+1         *0.92   0.07   0.01 
 2       1:+1       1:+1         *0.97   0.03   0    
 3       1:+1        2:0      +   0.47  *0.52   0.01 
 4       1:+1       1:+1         *0.89   0.08   0.03 
 5       1:+1       1:+1         *0.643  0.338  0.02 
 6       1:+1        2:0      +   0.22  *0.73   0.05 
 7       1:+1       1:+1         *0.45   0.21   0.34 
 8       1:+1       3:-1      +   0.16   0.19  *0.65 
...