Генерация описательной статистики для различных типов переменных в R - PullRequest
1 голос
/ 10 марта 2020

Я знаю, что существует множество пакетов / функций, таких как (janitor) "tabyl" & "paste c", чтобы получить описательные значения переменных, но я не знаю, как применять их только к определенным столбцам ,

Например,

library(pastec)
stat.desc(iris) 

вернет среднее значение / sd et c. Для всех переменных, но я хочу применить его только к цифре c переменных. Я не хочу использовать подмножество, потому что мой набор данных содержит более 20 столбцов, а столбцы чисел c чередуются в разных порядках.

Что-то еще, что я попробовал, это:

library(janitor) 
lapply(iris,tabyl)

Это замечательно, за исключением того, что я не хочу, чтобы табил применялся ко всем столбцам (потому что столбцы с 14 000 идентификаторами приводят к ужасному выводу) И моя конечная цель - добавить это в аккуратный файл Excel.

Есть идеи, как я могу применить эти классные функции для типов «цифра c» и типов «символ» / «фактор» отдельно? Или указать c столбцы, указанные в векторе?

1 Ответ

1 голос
/ 10 марта 2020
В пакете

{dplyr} есть несколько удобных способов выбора numeric, character переменных и т.д. c.

Например:

library(pastecs)
library(dplyr)

stat.desc(select_if(iris, is.numeric))

Удачи!

...