Сравнение значений столбцов в строке в рамках Pandas Dataframe - PullRequest
0 голосов
/ 17 ноября 2018

У меня есть конкретная и общая проблема, которую я пытаюсь решить.

Конкретная проблема: Я хочу создать новый столбец во фрейме данных, который дает 1, если столбец ifC1 равен 8, а все остальные значения в строке меньше 8. Как логически отрицать все остальные столбцы одновременно?Вот код из моей ошибочной попытки:

df["C1is_8"] = df.apply(lambda row:(row['C1']==8)& ~(row['C1']<8) ,axis=1).astype(int)

Приведенный ниже код создает кадр данных для кода выше.

dict = { 'C1':[4,3,0,0,2,3,4,5,8,8,8,8],
         'C2':[8,3,3,7,6,5,3,5,6,8,8,8],
         'C3':[2,3,6,4,5,0,0,4,6,7,8,8],
         'C4':[8,5,4,4,4,3,2,1,4,2,6,8]
       }
columns = ['C1','C2','C3','C4']
Index = [1,2,3,4,5,6,7,8,9,10,11,12]
df = pd.DataFrame(dict,index = Index,columns = columns)
df = OGdf[::-1]
df

Общая проблема: Как мнепереписать некоторую версию приведенного выше кода, чтобы я мог обобщить ее (например, row [i]), чтобы она могла применяться к любому столбцу, а не только к «C1»?

1 Ответ

0 голосов
/ 17 ноября 2018

Я думаю, что этот ответ удовлетворяет как ваши конкретные, так и общие проблемы, используя filter и all:

# define the column you want to apply your first condition to
col = 'C1'

# Python 3.6 or above, with f-strings:
df['new_col'] = ((df[col] == 8) & (df.filter(regex=f'[^{col}]') < 8).all(1)).astype(int)
# Otherwise:
df['new_col'] = ((df[col] == 8) & (df.filter(regex='[^{}]'.format(col)) < 8).all(1)).astype(int)

>>> df
    C1  C2  C3  C4  new_col
1    4   8   2   8        0
2    3   3   3   5        0
3    0   3   6   4        0
4    0   7   4   4        0
5    2   6   5   4        0
6    3   5   0   3        0
7    4   3   0   2        0
8    5   5   4   1        0
9    8   6   6   4        1
10   8   8   7   2        0
11   8   8   8   6        0
12   8   8   8   8        0
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...