Я пытаюсь соответствовать логистической регрессии.Я хочу разделить данные обучения и тестирования по аккаунту (переменная, которая не играет роли в подгонке).Я хочу, чтобы они были разделены на учетные записи, и каждая учетная запись может иметь много переменных.Например, 80% аккаунта будут обучать, 20% аккаунта будут тестировать.
Я пробовал следующее, но этот код просто дает мне 80% обучения и 20% тестирования в случайном порядке.Затем в обучающих данных, это даст мне некоторую учетную запись, но в тестировании данных, это также даст мне именно эту учетную запись только с различными переменными.Это не то, что я хочу.
X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = 0.20, random_state = 0)
Пожалуйста, сообщите.Спасибо!