Я построил лес изоляции с помощью sklearn и Python, и каждый раз, когда я запускаю модель для поиска аномалий, я получаю немного разные результаты.
В моих данных 100 строк, и каждый раз, когда я получаю различную комбинацию из 4-8 аномалий в пределах 90–100-й строки, кто-нибудь знает, почему это могло быть?
Спасибо за вашу помощь. Я приложил часть кода, который использовал.
from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2,random_state=0)
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)
model = IsolationForest(n_estimators = 100, max_samples = 'auto',
contamination = 'auto')
model.fit(df[['label']])
anomaly = df.loc[df['anomaly']==-1]