Изменить значение столбца случайной выборки подмножества панд данных? - PullRequest
0 голосов
/ 25 октября 2018

Имейте pandas dataframe вида

col1 col2 col3     tochange
a1   a2   group1   a4
b1   b2   group1   b4
...
i1   i2   group2   i4
...

, где col3 обозначает двоичную категорию меток для каждой строки (т. Е. Строка может быть в группе group1 или group2).

Хотелось бы установить значения tochange для некоторой константы для случайной выборки подмножества фрейма данных, где строки находятся в group2.То есть.Измените все значения X случайных строк в кадре данных подмножество df[df['col3'] == 'group2'] на все постоянные значения, скажем, "изменено".

В настоящее время изучается sample (X) , но не совсем уверен, как тогда заставить эти индексы возвращенного образца отобразиться обратно на исходный кадр данных, чтобы изменить столбцы этих строк.Буду признателен за любые дополнительные предложения или советы о том, как сделать то, что в конечном итоге пытается сделать здесь.

1 Ответ

0 голосов
/ 25 октября 2018

Использование shuffle после группы запросов2.при условии, что вы хотите случайную выборку n

n=10      
x=df[df['col3'] == 'group2'].index.values    
numpy.random.shuffle(x)    
df.loc[x[:n],'tochange']='something'
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...