Возврат рядов от определенного значения в пределах pandas df - PullRequest
1 голос
/ 28 мая 2019

Я пытаюсь вернуть серию, которая содержит некоторые дополнения из определенных значений в пандах df. В частности, для df ниже. Я хочу добавить все X's со всеми Y's. Это не в каком-то определенном порядке, хотя.

import pandas as pd

d = ({
    'Item' : ['X','Y','Z','X','Z','Y','Z'],                                     
    'Value' : [10,11,20,21,10,30,31],                                     
     })

df = pd.DataFrame(data=d)

Xs = df.loc[df['Item'] == 'X', 'Value']
Ys = df.loc[df['Item'] == 'Y', 'Value']

Out = Xs + Ys

Предполагаемая мощность:

21
51

Ответы [ 2 ]

1 голос
/ 28 мая 2019

Я предпочел ответ @jezrael, но хочу поделиться своими мыслями.

Xs = df.loc[df['Item'] == 'X', 'Value'].tolist()
Ys = df.loc[df['Item'] == 'Y', 'Value'].tolist()

Out = pd.Series(list(map(sum, zip(Xs, Ys))))

print(Out)
1 голос
/ 28 мая 2019

Вот проблема разных индексов, поэтому нужно же на Series.reset_index с drop=True:

Out = Xs.reset_index(drop=True) + Ys.reset_index(drop=True)
print (Out)
0    21
1    51
Name: Value, dtype: int64

Или, если возможно, на другую длину Series использовать Series.add:

Out = Xs.reset_index(drop=True).add(Ys.reset_index(drop=True), fill_value=0)

Или, если всегда возможна одна и та же длина Series, суммируйте 1d numpy массивов:

Out = pd.Series(Xs.values + Ys.values)
print (Out)
0    21
1    51
dtype: int64
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...