np.size и np. означают отсутствующие значения в столбце панд - PullRequest
0 голосов
/ 15 октября 2019

У меня есть набор данных с рейтингами фильмов, и я пытаюсь получить средний рейтинг каждого фильма и количество оценок для каждого фильма. Я использую функцию pandas agg для агрегирования столбца оценок и вычисления np.size и np.mean. Однако он продолжает возвращать значения NaN для некоторых фильмов, даже если они имеют по крайней мере 1 оценку. Я отброшу все фильмы, которые имеют только один рейтинг, но поскольку np.size возвращает некоторые значения NaN, я не знаю, какие из них отбрасывать

Изображение кадра данных рейтингов

Изображение пропущенных значений после выполнения кода ниже

movieProperties = ratings_df.groupby('movieId').agg({'rating': [np.size, np.mean]})
...