Ошибка IndexEr pandas pivot_table - PullRequest
2 голосов
/ 15 марта 2020

Система: WIN10

IDE: ANACONDA / Jupyter Lab

Язык: Python версия 3.7. 3

Библиотека: pandas версия 1.0.1

Источник данных: https://grouplens.org/datasets/movielens/

Набор данных: movies.csv; ratings.cvs (ml-25m.zip)

У меня возникла проблема по какой-то причине при попытке написать сводную таблицу. Объединенная таблица содержит более 25 миллионов записей, и мой код продолжает выдавать следующую ошибку: IndexError: индекс 993158425 выходит за пределы для оси 0 с размером 993157686

Были предприняты шаги:

  1. проверил форму фрейма данных для значений nan и очистил их.
  2. искал в Интернете код ошибки и не смог ничего найти
  3. пробовал различные способы записи сводной таблицы: .pivot и .pivot_table
  4. рассматривали перекрестную таблицу как обходной путь: это не будет работать

Код:

df1_movies = pd.read_csv('Data/movies.csv')
df1_ratings = pd.read_csv('Data/ratings.csv')

df1_main = pd.merge(df1_movies, df1_ratings, on='movieId')
table = df1_main.pivot_table(index='userId', columns='title', values='rating')

ошибка

IndexError: index 993158425 is out of bounds for axis 0 with size 993157686
...