Условное среднее от Pandas DataFrame - PullRequest
0 голосов
/ 19 ноября 2018

У меня есть датафрейм с несколькими столбцами данных о продажах недвижимости. Я хотел бы найти среднюю цену за квадратный фут 'ppsf' для всех продаж 1bed-1bath по почтовому индексу. Вот моя попытка (каждый ключ в dict - это почтовый индекс):

bed1_bath1={}
for zip in zip_codes:
    bed1_bath1[zip]= (df.loc[(df['bed']==1) & (df['bath']==1) & (df['zip']==zip)]).mean()

Проблема в том, что это добавляет среднее значение всех столбцов из информационного кадра в словарь. Я уверен, что есть лучший способ сделать это; может быть, используя numpy.where?

1 Ответ

0 голосов
/ 19 ноября 2018

(df[(df['bed']==1) & (df['bath']==1) & (df['zip']==zip)])['ppsf'].mean() сделает это.Вы просто выбираете интересующий вас столбец, прежде чем вычислять среднее значение (поэтому вы не будете даже выполнять обработку для остальных столбцов).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...