Что я получил: матрица, в которой я получил прогнозируемую вероятность результата (из модели логистической регрессии) и известный результат. Для этих любопытных я фактически получил две регрессионные модели и независимый набор тестовых данных, в котором я хотел бы сравнить эти две модели, выполнив это.
> head(matrixComb)
probComb outComb
[1,] 0.9999902 1
[2,] 0.9921736 0
[3,] 0.9901175 1
[4,] 0.9815581 0
[5,] 0.7692992 0
[6,] 0.7369990 0
Что я хочу: график, на котором я могу построить график того, как часто моя модель прогнозирования дает правильные результаты (одна строка для положительных значений и одна строка для отрицательных значений) в зависимости от предельного значения вероятности. Моя проблема в том, что я не могу понять, как это сделать, не переключаясь на Perl и не используя цикл For для перебора матрицы.
В Perl я бы просто начал с вероятности 0,1, а при прогоне цикла for увеличивал значение на 0,1. На первой итерации я буду считать все вероятности <0,1 и исход = 0 как истинные отрицания, вероятность <0,1 и результат 1 как вероятность ложных отрицаний> 0,1, а результат = 0 - как ложные срабатывания, а вероятность> 0,1 и результат = 1 - как истинные положительные результаты
Затем процесс будет повторяться, и результаты каждой итерации будут печататься как [вероятность, истинные положительные результаты / общее количество положительных результатов, истинные отрицательные значения / общее количество отрицательных значений]. Таким образом, мне будет легко распечатать его в open office calc.
Причина, по которой я спрашиваю это, состоит в том, что операция слишком сложна для меня, чтобы найти подобный случай здесь в stackoverflow или в учебном пособии. Но мне бы очень хотелось узнать, как сделать это эффективно в среде R.