матрица путаницы scikits с перекрестной проверкой - PullRequest
5 голосов
/ 16 марта 2012

Я обучаю классификатор svm перекрестной проверке (straifiedKfold) с использованием интерфейсов scikits Для каждого набора тестов (из k) я получаю результат классификации. Я хочу иметь матрицу путаницы со всеми результатами. Scikits имеет интерфейс матрицы путаницы: sklearn.metrics.confusion_matrix (y_true, y_pred) Мой вопрос заключается в том, как я должен накапливать значения y_true и y_pred. Они массивы (NumPy). Должен ли я определить размер массивов на основе моего параметра k-fold? И для каждого результата я должен добавить y_true и y-pred в массив ????

1 Ответ

2 голосов
/ 18 марта 2012

Вы можете использовать совокупную матрицу путаницы или вычислить ее для каждого раздела CV и вычислить среднее и стандартное отклонение (или стандартную ошибку) для каждого компонента в матрице в качестве меры изменчивости.

Для отчета о классификации код необходимо будет изменить, чтобы он принимал двумерные входные данные, чтобы передать прогнозы для каждого CV-раздела, а затем вычислить средние оценки и стандартное отклонение для каждого класса.

...