Если вы повторите эксперимент с различными размерами выборки, вы можете сравнить матрицы путаницы между экспериментами. Для этого вам не нужно видеть общее количество для каждой матрицы. Вместо этого вы хотели бы видеть нормализованные подсчеты, но вам нужно решить, хотите ли вы, чтобы нормализовались условия по общему количеству выборок («все»), прогнозируемому количеству классов («pred») или истинному количеству классов («true»). Например:
In [30]: yt
Out[30]: array([1, 0, 0, 0, 0, 1, 1, 0, 0, 0])
In [31]: yp
Out[31]: array([0, 0, 1, 0, 1, 0, 0, 1, 0, 0])
In [32]: confusion_matrix(yt, yp)
Out[32]:
array([[4, 3],
[3, 0]])
In [33]: confusion_matrix(yt, yp, normalize='pred')
Out[33]:
array([[0.57142857, 1. ],
[0.42857143, 0. ]])
In [34]: confusion_matrix(yt, yp, normalize='true')
Out[34]:
array([[0.57142857, 0.42857143],
[1. , 0. ]])
In [35]: confusion_matrix(yt, yp, normalize='all')
Out[35]:
array([[0.4, 0.3],
[0.3, 0. ]])