Я хотел бы посчитать, сколько пользователей оценили указанный c movieId? Я попытался использовать pandas .ilo c, но результат все еще не так, как ожидалось. Ожидаемый результат будет следующим:
Например, я использую набор данных MovieLens и, скажем, movieId 302 на самом деле имеет всего 10 пользователей с рейтингом этот параметр c mov ie.
Данные находятся в кадре данных. По вашему мнению, каким способом я должен попытаться получить ожидаемый результат? Я действительно ценю, если я могу учиться у вас. Спасибо.
!wget "http://files.grouplens.org/datasets/movielens/ml-100k.zip"
!unzip ml-100k.zip
!ls
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv("ml-100k/u.data", sep='\t',names="userId,movieId,rating,timestamp".split(","))
data