Система: WIN10
IDE: ANACONDA / Jupyter Lab
Язык: Python версия 3.7. 3
Библиотека: pandas версия 1.0.1
Источник данных: https://grouplens.org/datasets/movielens/
Набор данных: movies.csv; ratings.cvs (ml-25m.zip)
У меня возникла проблема по какой-то причине при попытке написать сводную таблицу. Объединенная таблица содержит более 25 миллионов записей, и мой код продолжает выдавать следующую ошибку: IndexError: индекс 993158425 выходит за пределы для оси 0 с размером 993157686
Были предприняты шаги:
- проверил форму фрейма данных для значений nan и очистил их.
- искал в Интернете код ошибки и не смог ничего найти
- пробовал различные способы записи сводной таблицы: .pivot и .pivot_table
- рассматривали перекрестную таблицу как обходной путь: это не будет работать
Код:
df1_movies = pd.read_csv('Data/movies.csv')
df1_ratings = pd.read_csv('Data/ratings.csv')
df1_main = pd.merge(df1_movies, df1_ratings, on='movieId')
table = df1_main.pivot_table(index='userId', columns='title', values='rating')
ошибка
IndexError: index 993158425 is out of bounds for axis 0 with size 993157686