почему я получаю IndexError при попытке получить отчет о профилировании данных? - PullRequest
0 голосов
/ 14 февраля 2020

Я недавно начал использовать python. И я пытаюсь получить отчет с помощью pandas_profiling, я сталкиваюсь с IndexError. Может кто-нибудь объяснить, как я могу это отладить?

Данные содержат около 30 переменных и около 800 000 строк.

До сих пор я пытаюсь прочитать файл CSV во фрейм данных и профилировать его с помощью pandas профилирование. Пользовательский код не написан [часть от использования стандартных библиотек и пакетов.

Заранее спасибо

import numpy as np
import pandas as pd
from pandas_profiling import ProfileReport
df_s = pd.read_csv(r'<file_path>')
ProfileReport(df_s)

Error below




---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
~\AppData\Local\Continuum\anaconda3\lib\site-packages\IPython\core\formatters.py in __call__(self, obj)
    343             method = get_real_method(obj, self.print_method)
    344             if method is not None:
--> 345                 return method()
    346             return None
    347         else:

~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas_profiling\__init__.py in _repr_html_(self)

~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas_profiling\__init__.py in to_widgets(self)

~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas_profiling\report\presentation\flavours\widget\sequence.py in render(self)
     95 
     96         elif self.sequence_type in ["tabs", "sections"]:
---> 97             widget = get_tabs(self.content["items"])
     98         elif self.sequence_type == "accordion":
     99             widget = get_accordion(self.content["items"])

~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas_profiling\report\presentation\flavours\widget\sequence.py in get_tabs(items)
     16     titles = []
     17     for item in items:
---> 18         children.append(item.render())
     19         titles.append(get_name(item))
     20 

~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas_profiling\report\presentation\flavours\widget\sequence.py in render(self)
     97             widget = get_tabs(self.content["items"])
     98         elif self.sequence_type == "accordion":
---> 99             widget = get_accordion(self.content["items"])
    100         elif self.sequence_type == "grid":
    101             widget = get_row(self.content["items"])

~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas_profiling\report\presentation\flavours\widget\sequence.py in get_accordion(items)
     59     titles = []
     60     for item in items:
---> 61         children.append(item.render())
     62         titles.append(get_name(item))
     63 

~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas_profiling\report\presentation\flavours\widget\preview.py in render(self)
      9         else:
     10             items = [self.content["top"]]
---> 11         return WidgetSequence(items, sequence_type="variable").render()

~\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas_profiling\report\presentation\flavours\widget\sequence.py in render(self)
     75         elif self.sequence_type == "variable":
     76             i1 = self.content["items"][0].render()
---> 77             i2 = self.content["items"][1].render()
     78             toggle = widgets.ToggleButton(description="Toggle details")
     79 

IndexError: list index out of range


1 Ответ

0 голосов
/ 25 марта 2020

У меня была такая же ошибка, затем я уменьшил число df_s, и это работает. Вы можете попробовать.

пример:

ProfileReport(df_s[:10000])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...