У меня есть следующий фрейм данных, и мне нужно разбить его на обучающие и тестовые наборы таким образом, чтобы при наличии одного конкретного идентификатора в поезде его не пришлось повторять в тестовом наборе.
Row ID AGE GENDER TIME CODE
0 1 66 M 1 0
1 1 66 M 2 0
2 1 66 M 3 1
3 2 20 F 1 0
4 2 20 F 2 0
5 2 20 F 3 0
6 2 20 F 4 0
7 3 18 F 1 0
8 3 18 F 2 0
9 3 18 F 3 0
10 3 18 F 4 1
желаемый результат в обучающем наборе должен быть таким:
Row ID AGE GENDER TIME CODE
0 1 66 M 1 0
1 1 66 M 2 0
2 1 66 M 3 1
3 2 20 F 1 0
4 2 20 F 2 0
5 2 20 F 3 0
6 2 20 F 4 0
, а тестовый набор должен быть примерно таким:
Row ID AGE GENDER TIME CODE
0 3 18 F 1 0
1 3 18 F 2 0
2 3 18 F 3 0
3 3 18 F 4 1
как это возможно в Pandas Python?
Спасибо заранее