Я использую изоляцию леса следующим образом для обнаружения точек данных выбросов моего набора данных.
#isolation forest
clf = IsolationForest(max_samples='auto', random_state=42, behaviour="new", contamination=.01)
clf.fit(X)
y_pred_train = clf.predict(X)
outliers = []
for item in np.where(y_pred_train == -1)[0]:
outliers.append(df_nodes[item])
Я хочу, чтобы прогнозируемые выбросы были в ранжированном списке. То есть я хочу знать, что было наиболее вероятным выбросом и следующим, и так далее (может быть отсортировано с использованием некоторой вероятности прогнозирования). Я пытался найти способ сделать это в sklearn. Однако я так и не смог найти выход. Пожалуйста, дайте мне знать подходящий способ сделать это.
Я рад предоставить более подробную информацию, если это необходимо.