У меня есть вектор номинальных значений, и мне нужно знать вероятность появления каждого из номинальных значений. В основном, мне нужны те, чтобы получить min, max, mean, std
вероятности соблюдения номинальных значений и получить значение Class Entropy
.
Например, предположим, что существует набор данных, в котором цель прогнозирует 0, 1 или 2. В наборе данных обучения. Мы можем посчитать количество записей, для которых их цель равна 1, и назвать его n_1
, и аналогично мы можем определить n_0
и n_2
. Тогда вероятность наблюдения класса 1 в наборе обучающих данных просто p_1=n_1/(n_0 + n_2)
. После получения p_0
, p_1
и p_2
можно получить минимальное, максимальное, среднее и стандартное значения этих вероятностей.
Легко получить это в python с помощью pandas
, но вы хотите избежать чтения набора данных дважды. Мне было интересно, есть ли какое-либо действие CAS в SAS
, которое может предоставить его мне. Обратите внимание, что я использую Python API от SAS до swat
, и мне нужно иметь API в python.