Boxplots / гистограммы для нескольких переменных в R - PullRequest
0 голосов
/ 18 февраля 2020

У меня большой набор данных с +100 наблюдениями и 68 переменными. Мне было интересно, может ли быть способ генерировать графики и гистограммы для всех этих переменных одновременно, без необходимости записывать код для блокпоста / гистограммы один за другим и сохранять их в папке в формате pns или в формате pdf.

возможно, я бы хотел, чтобы на одной странице было несколько графиков (я знаю, вы можете сделать это, используя "par")

Я знаю, что это, вероятно, простая часть кода, но это быть действительно полезным для меня. Спасибо

Хорошо. Думаю, примером могут служить данные из набора данных радужной оболочки:

"Sepal.Length Sepal.Width Petal.Length Petal. * 1 5,1 3,5 1,4 0,2 сета

2 4,9 3,0 1,4 0,2 сета

3 4,7 3,2 1,3 0,2 сета

4 4,6 3,1 1,5 0,2 сета

5 5.0 3.6 1.4 0.2 setosa

6 5.4 3.9 1.7 0.4 setosa "

Но вместо того, чтобы использовать только" Sepal.Length Sepal.Width Petal.Length Petal.Width "в качестве наблюдаемых переменных, У меня есть 68 из них. Меня интересует проверка нормального распределения для выборки по всем моим 68 переменным и блокпостам. Я знаю, как создавать блокпосты и переменную гистограммы для каждой переменной, но это займет много времени, и я предполагаю, что должен быть способ сделать это сразу, возможно, используя al oop или%>%?

1 Ответ

0 голосов
/ 18 февраля 2020

Посмотрите на пакеты DataExplorer, skimr и inspectdf. Все они создают резюме, как вы хотите. Эти статьи дают обзор:
https://www.littlemissdata.com/blog/simple-eda
https://www.littlemissdata.com/blog/inspectdf

...