В настоящее время я использую Jupyter Notebook версии 5.6.0 через Anaconda Navigator. Я пытаюсь разделить свой набор данных на Обучение и тестирование, но всякий раз, когда я выключаю и снова открываю свой ноутбук и повторно запускаю код, он создает другой набор для обучения и тестирования. Random_state работает, хотя, если я просто перезапустить код, не выключая ноутбук. Это нормально? Есть ли способ исправить это так, что даже если я закрою и снова открою ноутбук, он все равно разделит набор данных таким же образом>
Я установил случайное состояние метода train_test_split, но он по-прежнему вызывает другое разделение данных.
Вот мой код:
#Split dataset into Training and Testing
from sklearn.model_selection import train_test_split
y = train['Target']
x_train, x_test, y_train, y_test = train_test_split(train, y, test_size=0.2, random_state = 0)
x_train.head()
Результат первого запуска такой:
| ID | Country | Target
7093 | 9.56 | Tokyo | Yes
5053 | 9.58 | Bangkok | Yes
1627 | 9.53 | New York | No
2514 | 9.55 | Los Angeles | No
Значения повторного запуска показывают:
| ID | Country | Target
3805 | 9.51 | Chicago | No
6730 | 9.59 | Seattle | No
7623 | 9.57 | Busan | Yes
7045 | 9.60 | Seoul | Yes