У меня есть примерный фрейм данных, прочитанный с использованием панд.Данные имеют два столбца: «элемент», «метка».В то время как я тасую строки df, я хочу убедиться, что у shuffled df нет элементов с одинаковыми последовательными метками.то есть.это допустимо, поскольку метки «a», «b» и «c» расположены не в последовательном порядке:
1: огонь, «a»
2: дым, «b»'
3: медоносная пчела,' a '
4: занавес,' c '
, но я хочу избежать, чтобы метки были в последовательном индексе, т.е.:
огонь, 'a'
медоносная пчела, 'a'
дым,'b'
шторка, 'c'
Пока что я могу перетасовать, используя:
df = df.sample(frac=1).reset_index(drop=True)
У меня есть смутное представление о цикле до df['label'][i+1] != df['label'][i]
, но я точно не знаю, как это сделать.Любые указатели или более простое предложение будет оценено!