У меня есть набор данных с рейтингами фильмов, и я пытаюсь получить средний рейтинг каждого фильма и количество оценок для каждого фильма. Я использую функцию pandas agg для агрегирования столбца оценок и вычисления np.size и np.mean. Однако он продолжает возвращать значения NaN для некоторых фильмов, даже если они имеют по крайней мере 1 оценку. Я отброшу все фильмы, которые имеют только один рейтинг, но поскольку np.size возвращает некоторые значения NaN, я не знаю, какие из них отбрасывать
Изображение кадра данных рейтингов
Изображение пропущенных значений после выполнения кода ниже
movieProperties = ratings_df.groupby('movieId').agg({'rating': [np.size, np.mean]})