Не уверен, что был дан ответ, например, относительно Python, но я не смог найти его для R.
У меня есть классификатор, который будет генерировать матрицы путаницы. Я пишу явные функции в базе R для работы с мерами производительности для них. Такие функции (для таких показателей, как точность и отзыв) уже доступны в Inte rnet и StackOverflow. После вычисления классовой точности и напоминания я буду использовать макросреднее (то есть просто среднее) для каждого.
Мне интересно, если я ожидаю много нулей, имеет ли это больше смысла чтобы заменить отсутствующие значения в классовой точности и вызвать 0
перед взятием среднего значения, или лучше использовать na.rm=TRUE
(т.е. просто дисконтировать эти записи)?
Может ли иметь смысл используйте 0
для точности, поскольку это «ошибка» алгоритма, если он не сделал прогнозов в этом классе, но для отзыва мы должны использовать na.rm=TRUE
(поскольку это аспект самих данных, если строка не имеет записей, то есть один класс не имеет экземпляров)? Как вы думаете, какие-нибудь советы о том, как go обращаться с такими случаями для моих макро-средних значений?