Python: Как заменить только 0 значений в столбце умножением 2 столбцов в Dataframe на цикл? - PullRequest
3 голосов
/ 28 октября 2019

Вот мой Dataframe:

df={'pack':[2,2,2,2], 'a_cost':[10.5,0,11,0], 'b_cost':[0,6,0,6.5]}

Он должен выглядеть следующим образом:

this

В этот момент вы обнаружите, что a_cost и b_cost столбцы имеют 0, где другой столбец имеет значение. Я хотел бы, чтобы моя функция следовала этой логике ...

for i in df.a_cost:
    if i==0:
       b_cost(column):value *(multiply) pack(column):value
       replace 0 with this new multiplied value (example: 6.0*2=12)
for i in df_b.cost:
    if i==0:
       a_cost(column):value /(divide) pack(column):value
       replace 0 with this new divided value (example: 10.5/2=5.25)

Я не могу понять, как успешно написать эту логику ... Вот ожидаемый результат:

Dataframe

Вывод в коде:

df={'pack':[2,2,2,2], 'a_cost':[10.5,12.0,11,13.0], 'b_cost':[5.25,6,5.50,6.5]}

Помощь очень ценится!

Ответы [ 3 ]

2 голосов
/ 28 октября 2019

IIUC,

df.loc[df.a_cost.eq(0), 'a_cost'] = df.b_cost * df.pack
df.loc[df.b_cost.eq(0), 'b_cost'] = df.a_cost / df.pack

Вы также можете играть с mask и fillna:

df['a_cost'] = df.a_cost.mask(df.a_cost.eq(0)).fillna(df.b_cost * df.pack)
df['b_cost'] = df.b_cost.mask(df.b_cost.eq(0)).fillna(df.a_cost / df.pack)

Обновление в качестве комментария, вы можете использовать other in mask:

df['a_cost'] = df.a_cost.mask(df.a_cost.eq(0), other=df.b_cost * df.pack)

Также обратите внимание, что вторая фильтрация не требуется, если вы уже заполните 0 в столбцах a_cost. То есть мы можем просто сделать:

df['b_cost'] = df.a_cost / df.pack

после первой команды в обоих методах.

Вывод:

   pack  a_cost  b_cost
0     2    10.5    5.25
1     2    12.0    6.00
2     2    11.0    5.50
3     2    13.0    6.50
1 голос
/ 28 октября 2019
import numpy as np
df = pd.DataFrame({'pack':[2,2,2,2], 'a_cost':[10.5,0,11,0], 'b_cost':[0,6,0,6.5]})

df['a_cost'] = np.where(df['a_cost']==0, df['pack']*df['b_cost'], df['a_cost'])
df['b_cost'] = np.where(df['b_cost']==0, df['a_cost']/df['pack'], df['b_cost'])

print (df)
#pack  a_cost  b_cost
#0     2    10.5     5.25
#1     2    12.0     6.0
#2     2    11.0     5.50
#3     2    13.0     6.5
1 голос
/ 28 октября 2019

Попробуйте это:

df['a_pack'] = df.apply(lambda x: x['b_cost']*x['pack'] if x['a_cost'] == 0 and x['b_cost'] != 0 else x['a_cost'], axis = 1)

df['b_pack'] = df.apply(lambda x: x['a_cost']/x['pack'] if x['b_cost'] == 0 and x['a_cost'] != 0 else x['b_cost'], axis = 1)
...