Как только сгенерировать корреляции и графики разброса с помощью пакета Pandas Profilling? - PullRequest
1 голос
/ 07 мая 2020

Я обрабатываю большой набор данных и использовал пакет Pandas Profilling. Но поскольку набор данных велик, отчет создается слишком долго, и браузеры не могут его открыть. Итак, я использую команду mininmal = True, которая исключает матрицы корреляции и графики разброса. Есть ли способ сгенерировать только корреляционные матрицы и графики рассеяния, используя Pandas Profilling.

from pandas_profiling import ProfileReport
profile = ProfileReport(df, title='EDA_Raw_Data', html={'style':{'full_width':True}},minimal=True)
profile.to_file(output_file="EDA1_Raw_Data.html")

1 Ответ

1 голос
/ 07 мая 2020

Это частично возможно.

Чтобы настроить конфигурацию pandas -profiling для представления только диаграмм рассеяния (или шестнадцатеричных значений) и корреляционных диаграмм, вы можете начать с минимальной конфигурации:

https://github.com/pandas-profiling/pandas-profiling/blob/master/src/pandas_profiling/config_minimal.yaml

Затем измените конфигурацию, чтобы исключить вычисление, которое вы хотите отключить (например, установить выборки на ноль).

from pandas_profiling import ProfileReport
profile = ProfileReport(df, configuration_file="your_config.yml")
profile.to_file("EDA1_Raw_Data.html")

Обратите внимание, что в данный момент это невозможно отключить все вычисления (в v2.6.0). Пожалуйста, сделайте запрос функции в репозитории для этого.

(Отказ от ответственности: автор здесь. Обратите внимание, что предстоящая версия 2.7.0 включает в себя значительные улучшения производительности, которые также могут решить вашу проблему.)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...