У меня есть набор данных ~ 3700 строк, и мне нужно удалить 1628 из этих строк на основе столбца.Набор данных выглядит следующим образом:
compliance day0 day1 day2 day3 day4
True 1 3 9 8 8
False 7 4 8 3 2
True 4 5 0 3 5
True 5 3 9 6 2
для 1068 строк. Я хочу удалить всю строку, если соответствие = true.
Дело в том, что я хочу сделать это случайно;Я не хочу удалять первые 1063 строки.Я попробовал это:
for z in range(1629):
rand = random.randint(0,(3783-z)) #subtract z since dataframe shape is shrinking
if str(data.iloc[rand,1]) == 'True':
data = data.drop(balanced_dataset.index[rand])
Но я получаю следующую ошибку, после того как он удаляет несколько строк:
'labels [2359] not contained in axis'
Я также пробовал это:
data.drop(data("adherence.str.startswith('T').values").sample(frac=.4).index)
ГРП произвольно выбрано на данный момент, я просто хотел, чтобы это работало.Я получил следующую ошибку:
'DataFrame' object is not callable
Любая помощь будет принята с благодарностью!Спасибо