Данные участка и количество - PullRequest
0 голосов
/ 08 февраля 2020

У меня есть этот номер нью-йоркского airbnb house, полный набор данных доступен по адресу Kaggle .

the dataframe

Это мой код, в котором я получаю

  • number_of_reviews (в определенном c ценовом диапазоне и расстоянии от Уолл-стрит)
  • даты последних обзоров

Я слил эти два и отсортировал по убыванию. Затем я получаю 10 максимальных значений.

df = pd.read_csv("df.csv", index_col='id')
df = df.dropna()

manhattan = df.loc[(df['neighbourhood_group'] == 'Manhattan') & (df['room_type'] == 'Entire home/apt')]

mn_location = 110 * (np.arccos(np.sin(manhattan['latitude']) * np.sin(40.7038)
                               + np.cos(manhattan['latitude']) * np.cos(40.7038)
                               * np.cos(-74.0057 - manhattan['longitude'])))
mn = manhattan.copy()
mn['mn_location'] = mn_location.round(decimals=1)

range2 = mn[(mn['mn_location'] <= 2) & (mn['price'] > 155) & (mn['price'] <= 160)]


pie = range2[['number_of_reviews', 'last_review']].sort_values(by=['number_of_reviews'], ascending=False).head(10)

Я хотел бы построить график (по истории, разброс ... может быть, временную шкалу), на котором у меня есть по оси X даты (last_review) и по оси Y количество (number_of_reviews).

1 Ответ

0 голосов
/ 08 февраля 2020
pie.plot.bar(x = 'last_review', y='number_of_reviews')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...