Как найти средний рейтинг mov ie в год? - PullRequest
0 голосов
/ 09 апреля 2020

Привет, поэтому я сейчас работаю над IMDB mov ie метаданными, которые выглядят так:

enter image description here

Мне нужна помощь, чтобы найти средний рейтинг imdb в год. imdb_score за title_year.

Теперь я посчитал количество фильмов в год и сократил годы с менее чем 10 фильмами, чтобы это было актуально.

Я сделал следующее

years = df['title_year'].value_counts()
years

, а затем

years2 = years[years >= 10]
years2

, что привело к

2009.0    260
2014.0    252
2006.0    239
2013.0    237
2010.0    230
2015.0    226
2011.0    225
2008.0    225
2012.0    221
2005.0    221
2004.0    214
2002.0    209
2007.0    204
2001.0    188
2000.0    171
2003.0    169
1999.0    168
1998.0    134
1997.0    118
2016.0    106
1996.0     99
1995.0     70
1994.0     54
1993.0     48
1992.0     34
1981.0     33
1989.0     33
1987.0     32
1991.0     31
1988.0     31
1984.0     31
1982.0     30
1990.0     30
1985.0     29
1986.0     26
1980.0     24
1983.0     22
1978.0     16
1977.0     16
1979.0     16
1970.0     12
1971.0     11
1968.0     11
1969.0     10
1964.0     10
1976.0     10
Name: title_year, dtype: int64

Теперь я запутался, как вы находите средний рейтинг IMDB в год, потому что я хотел бы построить график впоследствии. Кто-нибудь может мне помочь?

1 Ответ

1 голос
/ 09 апреля 2020

Вы можете использовать pandas .DataFrame.groupby :

year_avg_score = df.loc[df['title_year'].isin(year2.index)].groupby('title_year')['imdb_score'].mean()

Шаг за шагом:

  • df.loc[df['title_year'].isin(year2.index)] фильтрует только годы с более 10 фильмов, которые вы уже вычислили.
  • Затем мы группируем title_year и выбираем столбец imdb_score.
  • Наконец, получаем среднее значение imdb_score.

Полученный кадр данных year_avg_score будет иметь год в качестве индекса и средний балл в виде столбца.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...