train_test_split
случайным образом разбивает данные на обучающие и тестовые наборы, поэтому вы будете получать разные разбиения при каждом запуске сценария.Если вы хотите, есть параметр random_state
, который вы можете установить на какое-то число, и это будет гарантировать, что вы получите одинаковое разделение при каждом запуске скрипта:
X_train, X_test, y_train,y_test = train_test_split(X,y, test_size = .5, random_state = 0)
Это должно дать вам точность0.96
каждый раз.