Как создать точечную диаграмму, используя Pandas, с указанием c данных из столбца, а не всех данных в столбце - PullRequest
0 голосов
/ 10 марта 2020

В настоящее время я использую

df.plot.scatter(x='Ice_cream_sales', y='Temperature')

Однако я хочу иметь возможность использовать только продажи мороженого, которые равны 5 долларам, и температуры, которые находятся точно на уровне 90 градусов.

Как бы я go об использовании указанных значений c, которые мне интересны, искажает ценность данных всего столбца?

1 Ответ

1 голос
/ 10 марта 2020

Самый простой способ сделать это - создать фрейм данных для интересующего вас подмножества значений.

Скажем, у вас есть фрейм данных df со столбцами 'Ice_cream_sales', 'Temperature'

import pandas as pd
import matplotlib.pyplot as plt

# Here we subset your dataframe where the temperature is 90, which will give you a 
# boolean array for your dataframe.
temp_90 = df['Temperature'] == 90

# Apply your boolean against your dataframe to grab the correct rows:
df2 = df[temp_90]

# Now plot your scatter plot
plt.scatter(x=df2['ice_cream_sales'] y=df2['Temperature'])
plt.show()

Я не уверен, почему вы хотите построить точечный график, где продажи = 5 долларов, а температура = 90. Это даст вам ровно одну точку данных.

Вместо этого вы можете использовать подмножество, используя неравенство :

high_temp = df['Temperature'] >= 90

Также будьте осторожны, чтобы не применять подмножества к обеим ваших переменных, иначе вы бы фальсифицировали любые отношения, которые вы пытаетесь показать, с помощью своего точечного графика.

...