определение частоты ошибок в классификации и почему некоторые исследователи используют частоту ошибок вместо точности - PullRequest
0 голосов
/ 18 октября 2018

Каково точное определение частоты ошибок в классификации?почему некоторые исследователи используют частоту ошибок, чтобы сообщить о своих результатах вместо точности?Я пытаюсь сравнить свои результаты для классификации текста с другими методами в литературе, но они использовали коэффициент ошибок вместо точности, и я не могу найти точное определение / уравнение, чтобы найти коэффициент ошибок моего метода.

1 Ответ

0 голосов
/ 18 октября 2018

Для классификации ваш вывод является дискретным (как если бы вы помещали предметы в ведра), поэтому точность имеет действительно простое определение:

точность = (# классифицировано правильно) / (# классифицировано всего)

Коэффициент ошибок одинаково прост:

коэффициент ошибок = 1 - точность = 1 - (# классифицировано правильно) / (# классифицировано всего)

= (# классифицировано неверно) / (# классифицировано итого)

Обратите внимание, что для задач с непрерывным выводом все намного сложнее.Если вместо того, чтобы помещать предметы в ведра, я прошу модель разместить предметы в числовой строке, точность больше не является вопросом «правильно» и «неправильно» , а скорее как близко моя модель направо.Это может быть средняя близость, медианная близость и т. Д. Существуют более сложные меры, которые отличаются главным образом тем, насколько сильно они взвешивают расстояние по мере его увеличения.Возможно, чуть-чуть хуже, чем много, так что мера ошибки Root Mean Square является подходящей.С другой стороны, может случиться так, что отключение более чем на небольшую величину ужасно, будь то отключение немного или много, поэтому логарифмическая мера ошибки будет лучше.


Toответьте на последнюю часть вашего вопроса: в дискретном случае, почему следует выбирать точность против ошибки?Оптика - это одно: "Точность 99%" отправляет психологическое сообщение, отличное от "с ошибкой 1%" .Кроме того, увеличение точности с 99% до 99,9% повышает точность на 1%, но уменьшение погрешности с 1% до 0,1% означает уменьшение погрешности на 90%, даже несмотря на то, что они отражают одну и ту же реальную реальность.изменить.

В противном случае это могут быть личные предпочтения или стиль написания.

РЕДАКТИРОВАТЬ: вас также может заинтересовать эта публикация на бирже стека статистики

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...